Special Report

エビデンスに基づく医療(EBM)探訪

関沢 洋一
上席研究員

健康で長生きすることは多くの人々の願いである。

この願いをかなえるため、人々は、病院に行って投薬を始めとするさまざまな治療を受けたり、定期健康診断を含めた医療関係の検査を受けたりする。また、食事の中身や量に気を使ったり、運動したりする。こうした取り組みは、多くの場合、そうした取り組みが寿命を延ばしたり生活の質を向上させたりするという仮説を信じることによって行われている。たとえば、血圧の高い人は降圧剤を服用することによって寿命が延びる、がん検診を受ければがんを早期発見・治療して長生きすることが可能になるといった仮説である。

こうした仮説は本当に正しいのだろうか。統計学的な検証に耐えうるだけの十分な根拠はあるのだろうか。このような問題意識に立脚した医学における取組みとして「エビデンスに基づく医療(根拠に基づく医療)」(Evidence Based Medicine, EBM)がある。このレポートでは、EBMを探訪することによって、今後の医療政策のあり方についてのヒントを得ることを目指したい。

EBMの概観

EBMとは、医療従事者や患者が医療に関わる意思決定(医療行為、検査、健康増進のための諸活動など)を行うに当たって、専門家の意見や主観的経験ではなく、適切に設計され実施された研究によって示されたエビデンスを重視しようとするアプローチを指す(注1)。一見当たり前に見えるこのアプローチの歴史は比較的新しく、1990年代初頭に打ち出されて、世界的に広まった(注2)。しかし、2013年に出版された津田敏秀氏の著書によると、EBMは日本においては「一向に広まらない」とされる(注3)。

EBMは、医学的介入についての統計学を使った効果検証というイメージが強いが、単に統計学的手法を使えばEBMの条件を満たすというわけではなく、信頼できるエビデンスを探求するための方法論が構築されている。たとえば、信頼できるエビデンスを提供する研究形態として、ランダム化比較試験がある。ランダム化比較試験では、ある医学的介入を受ける人々と受けない人々をランダムにグループ分けして(コインを投げて裏か表かでグループを決めるイメージ)、これらの複数のグループ間の比較によって介入に効果があったかどうかを検証する。複数のグループのどちらに入るかは偶然によって決まるため、バイアスがかかりにくくなる。

たとえば、定期健康診断を受けている人と受けていない人の間で、寿命を比較したときに、健康診断を受けている人の方が長生きするという結果が出たとしても、健康診断の受診による効果かどうかはわからない。健康診断を受ける人はそうでない人に比べて、所得が高かったり、健康に配慮したりする傾向があって、それが寿命の差の原因になっているかもしれない。ランダム化比較試験によって、研究参加に同意した人々をランダムに2つのグループに分けて、片方のグループの人には健康診断を受けてもらい、もう片方のグループは健康診断を受けないようにしてもらい、その後の寿命の違いを比較すれば、このような問題を減らすことができ、より正確な比較が可能になる。

「エビデンスに基づく医療」に基づいて、個々の医療行為などの効果検証を行う世界的なプロジェクトとして、コクラン共同計画がある(注4)。1993年にイギリスで立ち上げられたコクラン共同計画は、国際的なNPOとして活動が行われており、さまざまな医学的介入(投薬などの医療行為、健康診断、代替医療など広範囲に及ぶ)について効果検証を行っており、その結果はシステマティック・レビューとしてまとめられている。

コクラン・レビューにおいては、既存の研究の中からレビューの対象とすべき研究(大半はランダム化比較試験)を抽出した上で、メタ解析という統計学的手法を用いて、複数の研究を統合して1つの結果を導き出す(注5),(注6)。どの研究をレビューの対象とするかによってメタ解析の結果は変わるため、手続きの適切さを担保するために、レビューの対象となる研究を抽出するための基準がプロトコルという形で事前に決められ、レビューを実際に行う前に事前に公表される。このような厳格な手続きの設定によって恣意的な評価を避けることが目指されている。

以下では、代表例として、乳がんの検診手法であるマンモグラフィについてのコクラン・レビューについて概観することにしたい。

コクラン・レビューによるマンモグラフィの評価

2013年に公表されたコクラン・レビューにおいて、マンモグラフィががんによる死亡率や総死亡率を低下させるかについて検証が行われている(注7)。

このレビューにおいては、プロトコルに従ってMEDLINEなどの医学サイトの検索などを行った結果、8つのランダム化比較試験がメタ解析の対象となる資格のある研究として抽出された。これらの研究のうち、3つの研究が適切なランダム化が行われた研究に分類され、5つの研究が準最適なランダム化が行われた研究に分類された。その上で、適切なランダム化が行われた研究だけに限定したメタ解析が行われると共に、準最適なランダム化が行われた研究も含めたメタ解析が行われた。

適切なランダム化を行った3つの研究に限定した場合、乳がんによる死亡率は、7年後も13年後も、マンモグラフィを行った群と行わなかった群で、統計学的に有意な差がなかった。準最適なランダム化を行った研究も含めてメタ解析を行った場合には、マンモグラフィを行った群の方が乳がんによる死亡率が少ないという結果になった(7年後の乳がんによる死亡者数と母数(死亡者数/母数)は、検診群が558人/29万7812人、非検診群が747人/31万8515人)。

しかし、このレビューでは、乳がんによる死亡率を評価指標とする分析はマンモグラフィが有利になる方向でバイアスがかかってしまい、信用できないとしている。準最適なランダム化が行われた研究においては7年後の乳がんの死亡率が非検診群に比べて検診群において29%減少しているが、これが真実であると仮定すると、全てのがんによる死亡率もまた減っていなければならないのに、実際には減っていなかった。亡くなった人の複数の臓器にがんが発生している時に、特定のがんを死亡原因とすることが難しく、乳がんの検診を受けた人において死因の誤分類が生じた可能性があることが指摘されている。

乳がんによる死亡率よりもバイアスが少ないとされる全てのがんによる死亡率については、適切なランダム化を行った3研究のメタ解析の結果、マンモグラフィを行った群と行わなかった群で、10年後のがんによる死亡率において統計学的に有意な差がなかった(がんによる死亡者数と母数(死亡者数/母数)は、検診群が1451人/6万6013人、非検診群は1427人/6万6105人)。準最適な研究では、がんの死亡率についての信頼できるデータがなかった。

総死亡率(あらゆる原因による死亡)については、適切なランダム化を行った3研究のメタ解析では、7年後および13年後のいずれにおいても、2つの群の間で有意な差がなかった(7年後の総死亡者数と母数(総死亡者数/母数)は、検診群が3149人/11万9897人、非検診群が4190人/17万3061人)。但し、総死亡率に対する検診の効果を検証するためにはこの被験者数では少ないとされている(検出力不足)。準最適な研究では総死亡率についての信頼できるデータがなかった。

以上のとおりコクラン・レビューは、マンモグラフィを使った乳がんの検診の有効性に疑問を投げかける結果となっている。加えて、このレビューでは、マンモグラフィの弊害について言及している。1つ目の弊害として、マンモグラフィの受診者の中には偽陽性の結果が出る人がでて、何年にもわたって心理的な苦痛を経験することが挙げられている。2つ目の弊害として、マンモグラフィによって乳がんの過剰診断が行われることが指摘されている。それによると、マンモグラフィで発見された乳がんの中には成長が遅かったり自然に退縮したりするものも含まれており、こうした治療の必要性の乏しい乳がんまでもが治療されるとされる。ただし、現状では、マンモグラフィで発見されたがんが本当に治療の必要なものかどうかを見極めることはできないと指摘されている。

このレビューの要約として、検診によって乳がんによる死亡率が15%減少し、過剰診断と過剰治療が30%あると仮定した場合、2000人の女性が10年間検診を受けた場合に、1人が死ななくてすむ一方で、検診を受けなければ乳がんだと診断されなかったであろう健康な女性10名が不必要に治療を受け、200人以上が偽陽性によって心理的苦痛を経験するとなっている。

エビデンスのある医療はどれだけあるのか?

より一般的な話として、信頼に値する統計学的検証を経たエビデンスに支えられた医療的介入はどの程度あるのだろうか。BMJ Clinical Evidenceというホームページを見ると、ランダム化比較試験においてエビデンスの有無を検証した3000の治療法のうち、効果があるもの(beneficial)は11%、効果がありそうなもの(likely to be beneficial)が24%、効果と害のトレードオフになるものが7%、効果がありそうにないものが5%、有害そうなものが3%、効果があるかどうかわからないものが50%となっている(注8)。

エビデンスが不明瞭な医療的介入の具体的な例として、穏やかな高血圧への降圧剤の投与と定期健康診断についてのコクラン・レビューが私にとっては興味深かったので、以下で簡単に触れる。

穏やかな高血圧(最高血圧140~159、最低血圧90~99)に対する降圧剤の投与についてのコクラン・レビューは、穏やかな高血圧を抱えていて循環器疾患のない8912名のデータに基づいて行われており、4~5年間において、総死亡率、全循環器疾患のいずれにおいても、統計学的に有意な低減効果が見られなかった(総死亡者数と母数(死亡者数/母数)は、降圧剤を服用した群が77人/4481人、服用しなかった群が90人/4431人)(注9)。この結果は、降圧剤の服用に効果がないことを明らかにしたものではなく、むしろ、大規模な臨床研究が行われていないために、被験者数が少なすぎて結論を出せないということである(穏やかな高血圧だけが原因で死亡する人は少ないので、信頼に足る統計学的検証を行うには1万人弱では被験者数が足りない)。傾向としては、降圧剤を服用した群は総死亡率も全循環器疾患も少ない傾向があるようには見えるので、被験者数を増やした検証を行えば効果ありということになるのかもしれない(もちろん、やってみなければわからない)。

定期健康診断についてのコクラン・レビューでは、病気やリスク要因が事前に特定されていない18才以上の人々への一般的健康診断の便益と有害性について、複数のランダム化比較試験のメタ解析に基づいて検証を行っており、一般的健康診断によって、総死亡率も、特定疾患による死亡率も低下しないという結果になっている(注10)。研究の参加者数が多いこと、フォローアップ期間が長いこと、循環器疾患やがんによる死亡率が低下しなかったことを踏まえて、このレビューの著者は、一般的な健康診断には便益がなさそうだと結論付けている。

「エビデンスに基づく医療」の政策的インプリケーション

EBMの本来の趣旨は、医師や患者が医療関係の介入や取り組みを行うかどうかの決断を行うに当たって、より正確で適切な情報を提供しようというものだ。しかし、このような本来の趣旨を超えて、EBMの浸透が医療政策全体に大きなインパクトを及ぼす可能性もある。

一番ありそうなのは医療費への影響だ。最初に述べたとおり、多くの人々は、医療関係の取り組みを行う場合、そうした取り組みに効果があるという仮説を信じて行っている。この仮説が実は正しくない、あるいは、正しいかどうかわからないと知った場合には、そのような取り組みを行うことをためらう人もでてくるかもしれない。上述のマンモグラフィや穏やかな高血圧への降圧剤の服用はそのような可能性がある。そうすると、個々人の医療への支出額は減少するかもしれない。また、医療関係のガイドラインの作成や、保険適用の有無の判断においても、コクランなどのエビデンスが重視されると、エビデンスに支えられない医療行為を過度に行うことが減ってきて、医療費を減少させる方向に作用するかもしれない。

一例として、このレポートで取り上げたマンモグラフィについては、アメリカがん協会(American Cancer Society)のガイドラインでは40才以上の女性が毎年受診することを推奨していたが、EBMに基づいて米国予防サービスタスクフォース(The U.S. Preventive Services Task Force, USPSTF)は、2009年に、原則として50~74才の女性が2年に1度マンモグラフィを受診することを推奨している(注11)。後者の推奨に沿う場合、マンモグラフィに対するアメリカ全体の年間支出額が78億ドルから34.6億ドルに減少すると試算されている(注12)。その後、2015年10月に、マンモグラフィについてのアメリカがん協会のガイドラインは修正され、推奨される受診開始年齢が原則として40才から45才に引き上げられるとともに、55才からは原則として2年に1度の受診に移行することが推奨されている(注13)。

このように、EBMによって医療の質の低下を伴わない医療費削減が実現するかもしれないが、マイナスの影響もあるかもしれない。たとえば、医療関係者から見れば、長い時間をかけて習得した技術や開発した製品が一瞬にして無意味であると示されるリスクがある。そうすると、医療におけるR&Dのインセンティブが低下するかもしれないし、医療関係の仕事を目指して研鑽を積もうとする人が不必要に減少するかもしれない。また、効果の乏しい医療から得た収益が効果のある医療の赤字を補填している現状が仮にあれば、効果の乏しい医療から医療関係者が撤退すれば、効果のある医療に対する患者や公的主体の負担が増加するかもしれない。

以上のようにいくつかの可能性は書いてみたものの、それ自体エビデンスがない仮説であり、EBMの浸透がもたらす効果が全体としてどのようなものかは未知数だというのが正直なところである。日本国内でももっと研究された方が望ましいテーマだと思う。

おわりに

EBMを探訪して私が感じたのは、エビデンスによって示される医療情報と、世間で流布している医療情報の間に食い違いがあるように思えることだ。

たとえば、世間でよく見聞きする話では、高血圧には「サイレントキラー」という恐ろしいあだ名があって、高血圧で治療しないとあたかもすぐに死んでしまうかのようだ。しかし、上述したコクラン・レビューに掲載されたデータによれば、穏やかな高血圧になって降圧剤を投与して4~5年以内に死亡する確率は1.7%、投与しない場合に死亡する確率は2.0%となる。しかも、この差は統計学的に有意ではないので、偶然かもしれない。がんについても似たようなところがあって、検診を通じたがんの早期発見の重要性が我が国ではしばしば指摘されている(そして、おそらくは、多くの人々がこのことを当たり前のように信じている)が、コクラン・レビューによれば、少なくとも乳がんについては必ずしもそうとも言い切れないことになりそうだ。

医療政策については、医療費抑制の観点などから経済財政諮問会議などで積極的な議論が行われているが、報道を見る限りEBMの視点はあまり見られないようだ。EBMを踏まえながら、信頼に値するデータに基づくと個々の医療的介入がどの程度効果があると見込まれるか、また、それぞれの介入がどれくらいのコストがかかるのかを評価しながら、寿命を延ばしたりクオリティ・オブ・ライフを改善したりする上で、本当に必要な医療とそうでない医療を選り分けていくアプローチについても考えていく必要があるのではないだろうか。

また、医療を受ける側の人々が現時点における最良の医療情報にアクセスできて、医療的介入を行うかどうかの判断を主体的に行うことができるような環境を整えていくことも大切ではないだろうか。その際には医療情報を受け取る側のリテラシーの向上も重要になる(注14)。たとえば、ある治療が統計学的に見て有意に効果があるという信頼に値する研究があったとしても、死亡率が10%から9%に減る場合と、10%から5%に減る場合では、実際にその治療を行うかどうかの判断が異なってくるかもしれない。また、ある病気を治療した場合において死亡率が半分に減ると言っても、死亡率が10%から5%に減る場合と、1%から0.5%に減る場合では意味が異なり、後者であれば治療しないという選択肢もあるかもしれない。医療情報を受け取る側のリテラシーの向上も含めて、現時点で利用可能な最良の情報を医療関係者と一般国民の双方が入手でき、医療政策にもそのような情報が適切に反映されていくことを望みたい。

2015年10月26日
脚注
  1. ^ EBMの正確な定義としては以下に掲載されたものが広く知られている。Sackett, D. L., Rosenberg, W., Gray, J. A., Haynes, R. B., & Richardson, W. S. (1996). Evidence based medicine: what it is and what it isn't. BMJ, 312(7023), 71-72.
  2. ^ Evidence-Based Medicine Working Group. (1992). Evidence-based medicine. A new approach to teaching the practice of medicine. JAMA, 268(17), 2420-2425.
  3. ^ 津田敏秀『医学的根拠とは何か (岩波新書)』岩波書店、2013年。
  4. ^ Chandler, J., & Hopewell, S. (2013). Cochrane methods-twenty years experience in developing systematic review methods. Systematic reviews, 2, 76.
  5. ^ Cipriani, A., Furukawa, T. A., & Barbui, C. (2011). What is a Cochrane review? Epidemiology and psychiatric sciences, 20(3), 231-233.
  6. ^ Uman, L. S. (2011). Systematic reviews and meta-analyses. Journal of the Canadian Academy of Child and Adolescent Psychiatry, 20(1), 57-59.
  7. ^ Gøtzsche, P. C., & Jørgensen, K. J. (2013). Screening for breast cancer with mammography. Cochrane Database of Systematic Reviews, 2013(6). doi: 10.1002/14651858.CD001877.pub5.
  8. ^ BMJ Clinical Evidence. What conclusions has Clinical Evidence drawn about what works, what doesn't based on randomised controlled trial evidence? (http://clinicalevidence.bmj.com/x/set/static/cms/efficacy-categorisations.html)(2015年10月16日閲覧)
  9. ^ Diao, D., Wright, J. M., Cundiff, D. K., & Gueyffier, F. (2012). Pharmacotherapy for mild hypertension. Cochrane Database of Systematic Reviews, 2012(8). doi: 10.1002/14651858.CD006742.pub2.
  10. ^ Krogsbøll, L. T., Jørgensen, K. J., Grønhøj Larsen, C., & Gøtzsche, P. C. (2012). General health checks in adults for reducing morbidity and mortality from disease. Cochrane Database of Systematic Reviews, 2012(10). doi: 10.1002/14651858.CD009009.pub2.
  11. ^ US Preventive Services Task Force. (2009). Screening for breast cancer: US Preventive Services Task Force recommendation statement. Annals of Internal Medicine, 151(10), 716-726.
  12. ^ O'Donoghue, C., Eklund, M., Ozanne, E. M., & Esserman, L. J. (2014). Aggregate cost of mammography screening in the United States: comparison of current practice and advocated guidelines. Annals of internal medicine, 160(3), 145-153.
  13. ^ Oeffinger, K. C., Fontham, E. H., Etzioni, R., et al. (2015). Breast cancer screening for women at average risk: 2015 guideline update from the American Cancer Society. JAMA. 314(15), 1599-1614.
  14. ^ 医療情報を受け取る側のリテラシーの向上については以下の文献が役立つ。スティーヴン・ウォロシン、リサ・M・シュワルツ、H・ギルバート・ウェルチ『病気の「数字」のウソを見抜く』日経BP社、2011年、H・ギルバート・ウェルチ、リサ・M・シュワルツ、スティーヴン・ウォロシン『過剰診断: 健康診断があなたを病気にする』筑摩書房、2014年、名郷直樹『「健康第一」は間違っている』筑摩書房、2014年。

2015年10月26日掲載

この著者の記事