「エビデンス」という言葉は日本国内でちょっとしたブームになっているようで、日本政府内でエビデンスに基づく政策立案に向けて検討が進められているし、エビデンスに関する一般向けの本もいくつか出版されている[1, 2]。
エビデンスという発想の原点になっていると思われるのは、1990年代の初頭に打ち出された「エビデンスに基づく医療(EBM)」で、この言葉は世界的に広まった。ところが、エビデンスの本家とも言うべきEBMがうまくいっていないという論調が最近出ている。代表的な主張が、スタンフォード大学のヨアニディス教授による「エビデンスに基づく医療がハイジャックされている(Evidence-based medicine has been hijacked.)」[3]というものである。製薬業界を始めとする医療関連産業の関与の下で多くのランダム化比較試験やメタ解析が行われる結果として、本来は中立的であるべきエビデンスについて医療関連産業の望む方向にバイアス(真の数値からの乖離)が生じてしまい、本当に信頼できるエビデンスが得られなくなっているという危惧感が抱かれている。似たような指摘は複数の研究者によってなされている[4-7]。
このレポートでは、データの制約でなく意図的な取り組みによってエビデンスが歪められる主な事情について触れていきたい。なお、ランダム化比較試験(RCT)、システマティックレビュー、メタ解析といった用語については前回のレポートで触れたので、とりあえずそれを参照していただきたい。詳しく知るためには大田[8]が参考になる。
1. 公表バイアス
(1)概要
多くの場合、医療におけるエビデンスは、医学雑誌に掲載された臨床研究(特にRCT)や、複数の臨床研究の効果を総合的に判断するシステマティックレビューとメタ解析によって形成される。世の中で行われた臨床研究が全て医学雑誌に掲載されていれば、その結果を判断するシステマティックレビューの結果が適切なものになりやすくなる。しかし、現実には、臨床研究の結果は全て公表されているわけではない。特に、何らかの取り組み(投薬・心理療法など)について効果があるかどうかを検証する研究を行って効果がないという結果になった場合には医学雑誌に掲載されない傾向がある[9, 10]。これは公表バイアス(publication bias)と呼ばれる。
たとえば、抗うつ薬について、アメリカ食品医薬品局(FDA)には詳細な研究情報が製薬会社から報告されることを利用して行った研究[11]では、抗うつ薬の効果についての74の研究のうち、効果があったとする研究は38件あって、そのうち37件は公表され、公表されなかったのは1件だった。一方、効果がない研究は36件あって、そのうち公表されたのは14件で、22件は公表されなかった。効果がない研究で公表されたもの14件のうち、3件は効果がないと報告していたが、11件は効果があるかのような報告をしていた。
公表バイアスが起きる原因としてありそうなのは次のことだ。第1に、多くの臨床研究は製薬会社など民間企業がスポンサーになって行われており、研究スポンサーにとって望ましくない結果が出た場合には、それを公表することをためらう[4]。第2に、介入行為に効果がなかった場合には、効果がなかったために、また、関心が持てないために、研究者にとって、専門誌に投稿する意欲がわかなくなる[9]。なお、効果がなかったり乏しかった研究を医学雑誌の編集者が掲載したがらないという仮説もあり得るが、これはいくつかの研究で否定されている[12, 13]。
(2)公表バイアスに起因する問題
公表バイアスがあると信頼できるエビデンスを形成することは難しくなる。特に大きな問題は、エビデンスとして最高レベルにあると言われるランダム化比較試験(RCT)のシステマティックレビューの結果にバイアスがかかることだ[14]。システマティックレビューでは、たとえば、「抗うつ薬がうつ病になった人々のうつ症状を軽減させるか」といったリサーチクエスチョンを設定して、この問いに答えられそうなRCTを検索などによって選び出して、メタ解析という分析によって、全体としてどの程度の効果があるかを検証する。この場合、リサーチクエスチョンに合致した全てのRCTがメタ解析の対象になるべきだが、効果がなかったり乏しかったりした研究が医学雑誌に掲載されていなかったために分析対象から外れると、メタ解析の結果が本当の結果よりも良く見えてしまう[15]。
メタ解析では公表バイアスの有無を検証するファンネルプロットというツールはあるが、公表バイアスの有無を正確に知ることは難しい[16]。公表バイアスを生じないようにするため、近年は臨床研究を開始する前に事前に登録することが求められている。ただ、依然として公表されない研究は多い[17]。たとえば、アメリカの国立衛生研究所(NIH)が支援した研究で登録されたものであっても約3分の1が公表されなかったという報告がある[18]。
また、仮に新しい研究は事前に全て登録して全ての結果を公表するようになったとしても、多くのメタ解析では古い研究も対象に含めて分析することが多く、かつては登録制度がなく、古い研究では公表バイアスが発生しやすい傾向があることから[19]、古い研究を含めたメタ解析において公表バイアスが残ることが懸念される。
(3)公表バイアスが問題となった例(タミフル)
公表バイアスが特に問題となった例として、インフルエンザの重症化を防ぐ薬であるタミフルが挙げられる[20-23]。EBMを推進する国際的なNGOであるコクラン[8]がタミフルの効果についてシステマティックレビューを行おうとして、最初は医学雑誌に掲載された論文だけを使ってレビューすることを試みたのだが、レビュー過程において相当な量の非公表データがあることがわかってきた。レビューの実施者や医療雑誌のBMJは各国の規制当局や製薬会社に非公表データの提供を求め、当初はデータ提供を拒んでいた製薬会社が最終的にデータ提供に応じた。公表されていなかったデータは全体の60%に及んでいた。全てのデータを使って行われたメタ解析の結果では、タミフルには、インフルエンザらしき症状を1日未満減少させたものの、入院を減らす効果は確認されず、肺炎のような合併症を減らすかどうかについては、肺炎などの定義が明確にされていなかったためにわからなかった。有害事象として、吐き気、嘔吐、精神的症状が見られた。全体として、従来考えられていたよりも、タミフルの効果は小さく、有害事象は大きいと評価されている。
タミフルは、WHO(世界保健機関)の必須医薬品のモデルリストにおいて、2017年に、コアリスト(core list)から補完リスト(complementary list)へと格下げされた[24]。
2. 意図的な取り組みによって生じた公表バイアス以外のバイアス
(1)選択的報告
公表された研究においても、有害事象など問題がある事象については十分に報告されていない場合が多い[25-27]。たとえば、高脂血症の薬であるスタチンの効果を検証したメタ解析では、対象とした研究数は全部で19件で、総死亡率については15件の対象研究があったが、深刻な有害事象については対象研究数が7件で、糖尿病については6件にとどまっていた[28]。このような選択的報告がバイアスを引き起こしている可能性があるという指摘がある[29]。
(2)企業がスポンサーになった臨床研究
薬や医療機器の臨床研究においてその製造メーカーがスポンサーになっていると、他のスポンサーによる臨床研究に比べて、その製品に有利になる結果が出やすいことが報告されている[30]。バイアスのリスクを評価するための手段がコクランレビューなどではあるが[8]、こうした手段では企業がスポンサーになることによるバイアスはとらえきれないようだ[30, 31]。
(3)システマティックレビューとメタ解析におけるバイアス
複数の臨床研究の結果を体系的に精査して総合的な結論を出すシステマティックレビューとメタ解析は、医学におけるエビデンスとして最も強いものとされている。理想的には、個々の臨床研究が行われる前に、システマティックレビューとメタ解析を行うやり方(プロトコル)を決めておいて、分析対象となる臨床研究の抽出法や分析方法を個々の研究結果を見た後で恣意的に変更できないようにするのがいいが、現実には、既に臨床研究がいくつも行われて結果が公表された後で、プロトコルを決めてレビューすることが行われている[32]。この場合、個々の臨床研究の結果を見た上で、プロトコルを調整することによって望ましい結果に誘導する余地が出てくる。
メタ解析がマーケッティングのための強力な手段として使われていることを示す例として、ヨアニディスらは抗うつ薬の例を挙げる[32, 33]。それによると、うつ病に対する抗うつ薬の治療についてのメタ解析は2007年から2014年までに185件見つかって、そのうち、54件(29%)は評価された抗うつ薬のメーカーの従業員が執筆者になっていて、147件(79%)は何らかの形で企業との結びつきがあったそうだ。また、全体の185件のうち、論文の要旨において、抗うつ薬についてネガティブな記述をしているのは58件あったが、抗うつ薬のメーカーの従業員が執筆者になっている場合(54件)にはネガティブな記述をしているのは1件しかなかったのに対して、それ以外の場合(131件)には、57件がネガティブな記述をしており、メーカーの従業員が執筆者になったメタ解析が論文の要旨でネガティブな記述をすることはほとんどないという結論になった。ヨアニディスらは、ある製品のメタ解析がその製造メーカーと結びつきのある著者によって行われる場合には慎重な解釈が必要だとしている[33]。
3. 日本で起きた極端な(?)例
以下ではケーススタディとして、ディオバン事件と呼ばれる日本で起きた刑事裁判を取り上げる。この裁判では、2017年3月16日に東京地裁の判決が出されている(平成26年特(わ)第914号、第1029号)。
ディオバンという降圧剤が他の降圧剤よりも循環器疾患の予防効果が大きいかどうかを検証するランダム化比較試験(後述の判決文ではAStudyと呼ばれる)が、ディオバンの製造・販売を行う製薬会社(被告会社)の支援の下、日本で行われた。医学雑誌に当初掲載された結果(後に撤回されている)では、主要な循環器疾患(プライマリー・エンドポイント)の発生件数(イベントという言葉が使われる)について、ディオバン群では1517人中83人でイベントが発生したのに対して、ディオバンを投与しなかった群では1514人中155人でイベントが発生した[34]。他の薬の代わりにディオバンを使うことによって、循環器疾患が45%減ることになる。ところが、実際にはディオバンを投与しなかった群のイベント発生件数は水増しされていて、本当の数字から約40人増えていた。判決によって認定された事実では、この水増しはこの研究に参加していた製薬会社の従業員(被告人)によって行われたとされている。また、この判決では、ディオバンの効果が実際よりも高いことを示そうと医師が関与したことを示す記述も出ている。長いが重要なので、そのまま引用する。
「実際にも、証拠上明らかなものとして、滋賀県内にあるA大学関連病院の循環器内科副部長や部長であったAStudy参加医師は、イベントについて虚偽の報告をし、又は意図的にイベントの報告をしないことを繰り返していた。すなわち、同医師は、①非ARB群(引用者注:ディオバン以外の降圧剤が投与された群)に割り付けられた症例のうち十数例について、イベントに該当する症状が見られないにもかかわらず、C票(引用者注:イベントの有無、内容、発生日を登録するもの)により、狭心症の悪化による入院、PCIの施行等のイベントが発生した旨の虚偽の報告を行い、②B剤群(引用者注:ディオバンが投与された群)に割り付けられた症例のうち3例で狭心症が発症していたにもかかわらず、うち2症例について意図的にC票によるイベント報告をしなかった。その動機は、AStudyの結果が狭心症等の虚血性心疾患の発症においてB剤優位の有意差を示すものであれば、発表に値するものとなり、その結果、AStudyに対する自身や所属病院の貢献が、A大学関連病院を含む医局出身医師の人事に大きな権限を有するC1に評価されることを期待したというものであった。」(15ページ)
この事件がRCTがあまり行われない日本で行われた極めて例外的な出来事なのか、氷山の一角なのかは私には全くわからない。ただ、ここに出てくることがもしも頻繁に行われていれば、エビデンスに基づく医療(EBM)は、虚偽のデータを分析して得られた信頼できない医療に成り下がり、患者や医療関係者の適切な意思決定にとって有意義どころか、有害なものとなるだろう。
なお、この事件は、東京地裁の判決では被告会社も被告人も無罪となっている。イベント発生件数の水増しは認定されたのだが、虚偽の内容を含んだ論文を医学雑誌に投稿・掲載することは薬事法第66条第1項で禁止された誇大広告等には当たらないとされたためである。
4. まとめ
民放のテレビ番組を見れば膨大な量の広告を見ることになるが、自社の製品の問題点を列挙する広告を見ることはめったにない(私は見た記憶がない)。製薬業界などの医療関係業界にとっては医学雑誌も広告みたいなもので、望ましい効果は大きく見せて、有害事象はあまり見せないようにするというのは自然なことなのかもしれない。しかし、テレビの広告をそのまま信じる人は少ないと思うが、専門家によるチェックである査読を経た医学雑誌に掲載された結果であれば多くの人々はそのまま信じてしまうのではないだろうか。
製薬業界が資金源となった研究を医学雑誌は掲載すべきでないという主張もあるが[35]、少数派のようだ。企業からの支援を受けず、公的な資金で行う独立した臨床研究を増やすべきだという提案もなされているが[5, 6]、実際には逆の方向に向かっているようで、米国の登録件数で見ると、国立衛生研究所(NIH)が資金拠出した研究が減少する一方(2006年:1376件、2014年:1048件)、企業が資金拠出した研究は増加している(2006年:4585件、2014年:6550件)[36]。日本の場合、財政事情は年々悪化しているから公的資金を投入した研究を大々的に行うのは難しいだろう。
今回調べれば調べるほど、医療関係の介入には本当にエビデンスがあるのか(効果があるのか)がわからなくなってきた。RCTやメタ解析によって効果があると指摘されているもの、たとえば、血圧を下げる降圧剤や、コレステロール値を下げる薬であるスタチンが、人々の寿命を延ばしたり心臓疾患や脳卒中を減らすのかについて、真実はどこにあるのかがよくわからなくなってきた。一流の医学雑誌に掲載された論文で指摘されたとおりに効果があるのかもしれないが[37, 38]、もしかしたら公表バイアスを始めとするバイアスがあって、効果が過大評価されているのかもしれない。私のような外部の人間には何もわからない。EBMが本当にハイジャックされているかどうかはわからないが、ハイジャックされていると疑わざるを得ないだけでも、EBMは大きな問題を抱えているのだろう。
ただ、EBMを調べていて学んだと思えることはあって、その中の主なものは、医療による介入の効果はこれぐらいだという大体の感じはつかめるということだ。たとえば、コレステロール値が高い人々(平均年齢が58歳で女性が68%)について、食事療法だけを行った群(統制群)と、食事療法に加えてスタチンを処方された群(介入群)を比べた日本のRCTでは、概ね5年間で、統制群で3966人中172人に循環器疾患が発生したのに対して、介入群では3866人中125人に循環器疾患が発生した。総死亡者数は統制群で79名、介入群で55名だった[39]。この結果を見る限り、60歳前後でコレステロール値が高い日本人のほとんどはスタチンを服用しても服用しなくても循環器疾患を経験しないし、すぐに死ぬこともない。
「コレステロール値が高いと危険だ」という単純化された議論からデータに基づいた定量的なリスク評価へと議論を切り替えることができるだけでもEBMには価値があるのではないだろうか。