EBPM Report

EBPMとは何か?

関沢 洋一
上席研究員

はじめに

EBPM(Evidence Based Policy Making)は、「証拠に基づく政策立案」と日本政府の文書では翻訳され、政府全体で推進されている。EBPMとは何かについては、平成30年度内閣府取組方針では「政策の企画立案をその場限りのエピソードに頼るのではなく、政策目的を明確化したうえで政策効果の測定に重要な関連を持つ情報やデータ(エビデンス)に基づくものとすること」とされている。

EBPMについては、RIETIにおいても山口 一男氏をリーダーとするプロジェクトの研究会において出席者の間で熱心に議論が繰り返されている。この中で、EBPMとは何かというそもそも論が何度も議論されているが、未だ決着していない。本稿では、EBPMとは何か、EBPM関係で頻出する「効果」という言葉の意味は何か、データ整備や活用はEBPMか、エビデンスの乏しい政策をどう扱うべきかについて、私なりの考えを述べる。

1.EBPMとは何か?

上記の研究会の議論や医療におけるEBM(Evidence Based Medicine、エビデンスに基づく医療)を踏まえながら、EBPMについての実践的な定義として私なりに考えているものは以下のものである(注1)。

EBPM=個々の政策に実質的な効果があるかどうかを可能な限り厳密に検証して、実質的な効果があるという証拠があるものを優先的に実施しようとする態度

(1)効果の意味

ここで効果があるというのは、何らかの目指すべき目標があって、ある政策を実施することによってその目標に近づくことを指す。たとえば、メタボ健診制度という政策が寿命を延ばしたり重大疾患を減らすことが主たる目標としている場合、メタボ健診制度を行うことによって実際に寿命が延びたり重大疾患が減っている場合には目標に近づいているので、効果があることになる。

政策の目標は、それ自体は数値化されていないものも多いが、EBPM推進に当たっては、アウトカムと呼ばれる定量的な指標を目標となる数値として設定するのが通常である。

(2)因果関係の重要性

ある政策が効果を有すると言えるためには、政策→アウトカムの改善という因果関係が必要になる。上記のメタボ健診の例で言えば、メタボ健診を受ける人々は受けない人々に比べて、寿命が長かったり重大疾患の発生リスクが少なかったりするかもしれないが、これは効果があることを必ずしも意味しない(因果関係があるかどうかわからない)。メタボ健診を受ける人々は受けない人々に比べてもともと健康だったり、メタボ健診を受診する人々は健康改善の意欲が高かったりするなど、健診を受ける人と受けない人の間に最初から違いがある可能性があるためである。

現実には、ある政策の実施がアウトカムの改善に結びついているかどうか(因果関係があるかどうか)を検証することは難しく、日本で行われている政策のほとんどは効果があるのかどうか分からない。というより、世界的に見ても、効果があることが分かって行われている政策の方がおそらくは少ない。

因果関係の有無をどうしたら明らかにできるかについては、伊藤 公一朗氏や中室 牧子氏・津川 友介氏によるわかりやすい本が出版されている[1, 2]。因果関係の有無を明らかにする上で理想的なのは小中学校の理科で行うような1つだけ条件を変えるシンプルな実験を行うことであり、その代表的なものがランダム化比較試験(RCT)と呼ばれている。

例えば、メタボ健診と似た健康診断と健康指導のパッケージについては、デンマークで大規模なRCTが行われており、健康指導パッケージが寿命の延びにも重大疾患の減少にもつながらなかった、つまり効果がなかったとされている[3]。

(3)因果関係が全てではない〜「実質的な」効果の重要性

EBPMの上記の定義では、「実質的な効果」という表現を使っている。これは政策の効果がある程度大きなものであるべきという趣旨である。

因果関係を強調し過ぎる場合には、効果は小さくても因果関係があればある政策の実施が正当化されることになりかねない。これだと限られた人的物的リソースが有効に使われない恐れがある。

EBPMの先輩ともいうべき医療のEBMでは、統計学的な有意差だけで効果の有無を測定するのではなく、効果の大きさを明らかにするための取り組みが行われている。たとえば、NNT(=number needed to treat)という指標があり、ある治療によって1人の人間が救われるためには何人の人々がその治療を受ける必要があるかという概念である。この数値が大きければ、統計学的な意味での効果はあるとしても、実質的な効果は小さくなる。

「実質的な」効果という言葉が示すもう1つ重要な点は、この言葉を持ち込むことによって実験的な手法による因果関係の検証が必ずしも必要なくなることである。信頼できるデータを検証したり論理的な考察を積み重ねたりすることによって、効果が仮にあったとしてもそれが限定的であることがわかる場合がある。

一例として、男性に対する乳がん検診制度を創設するかどうかを検討することを考えてみる。男性の乳がん検診についてのRCTはおそらくなく、男性の乳がん検診が男性の乳がんによる死亡リスクを減少させるかどうかは分からない。しかし、データを見れば分かるが、乳がんによって死亡する男性の数は極めて少ない(ゼロではないことに注意)。もしかしたら本当は男性の乳がん検診は男性の乳がんによる死亡率を減らす因果関係はあるかもしれないが、データを見ることによって、RCTを行わなくても、実質的な効果が極めて小さく、男性に対する乳がん検診制度を創設する必要性は極めて低いことがわかる。

もう1つの例として、幼児教育の無償化がある。ノーベル経済学賞を受賞したヘックマンの主張として、幼児教育を行うと将来の所得が増えるという議論があり、それも一因となってか、あたかも、日本で幼児教育を無償化すると将来の所得が増えるかのような主張が行われた。これについて、赤林 英夫氏がデータと論理的考察に基づいて説得力のある反論を展開している[4]。要約すれば、①日本はアメリカと異なって5歳児の就園率は96%と既に高い水準にある、②幼児教育を受ける経済的余裕のない家庭に対する助成制度が既に存在している、ことが指摘されている。赤林氏の議論でわかるように、幼児教育を無償化する→幼児教育を受ける子供が増える→将来の所得が増える、というロジックは、実際には幼児教育を受ける子供の増え幅が限定的なため、将来の所得を増やす上では効果が乏しいことが推察される。

2.データ整備や活用はEBPMか?

ここでデータ整備とは、さまざまな統計を作ったり、統計データの数値がより正確なものになるようにしたり、データへの研究者のアクセスを改善するといったデータ関係の一連の取り組みである。

私は、データの整備や活用がEBPMの手段として役立つ場合があることは認めるものの、EBPMそのものではないと思っている。

データの整備がEBPMに資する例としてデンマークで行われた上記の健康指導のRCTがある[3]。デンマークでは10桁の登録番号が全国民に付与されており、死亡だけでなく重大疾患の経験などさまざまなデータが国によって管理されている[5, 6]。このRCTでは、デンマークのいくつかの地方公共団体の特定年に生まれた全住民を対象として、ランダム化によって健康診断・指導プログラムの案内を送った人と送らなかった人に分けて、2つのグループで比較している(厳密には、健康指導を受けた人と受けない人の違いではない)。健康指導の案内を送られなかった人々は研究に参加していることも知らされていないのだが、アウトカムとなる指標である死亡や重大疾患についてのデータは国が保有しているので、研究実施者はそのデータを自ら計測する必要がなく、参加者の登録番号だけがわかれば良かった。つまり、デンマークの高度なデータ整備制度のおかげで、大規模なRCTが行いやすくなったことになる。デンマークでは健康診断・健康指導関係のRCTや大規模な観察研究がいくつかあるが[3, 7-9]、これは同国の優れたデータ整備とは無関係ではないだろう。

ただ、データを整備すればそれはEBPMということではない。政策効果の検証に役に立たなければEBPMとは言えない。また、政府の資料でグラフや表が増えればEBPM推進ということでもない。

3.エビデンスの乏しい政策をどう扱うべきか?

エビデンスの乏しい政策と言うとき、実際には2つの別なものを指している[10]。1つ目は、効果の有無が検証されていなかったり検証する術がなかったりするために効果があるかないかが分からない場合である(no evidence of effect、以下ではNEE)。2つ目は、効果の検証が行われた結果として効果が乏しいと判断される場合である(evidence of no effect、以下ではENE)。

世の中の政策のほとんどはNEEに当たる。NEEの場合には実際には効果があるかが神様には分かっていても、人間には分からない。この場合には上述した男性の乳がん検診や幼児教育の無償化の例のように、データや論理的思考を使って効果の範囲がどこからどこにおさまるかなどの推測をした上で、最終的には政治的判断に基づいてその政策を行うかどうかを決めざるを得なさそうである。ただ、NEE型の政策の中にはRCTなどによる検証を行うことが可能なものもあるので(小学校での英語教育やストレスチェック制度の効果など)、国民へのインパクトの大きなものを中心に特区などを活用して効果検証を進めていくことは今後重要になると思う。

ENEの事例はあまり思いつかないが、主なものとして、肺がんによる死亡を予防するための胸部X線検査がある。これは定期健康診断の一項目であるという意味では政策に属するが、外国の大規模なRCTやシステマティックレビュー(複数のRCTの結果を体系的にまとめたもの)によって効果が否定されている[11, 12]。定期健康診断や健康指導についても概ね効果が否定されている[3, 13]。

一般論として、ENEに属する政策は、NEEと異なって行わない方が望ましいだろう。しかし、現実にはさまざまな利害関係が存在しているために、その実施が結局は政治的判断に委ねられざるを得ない時があるだろう。それ自体は仕方ないかもしれないが、それだけにとどまらず、エビデンスと政策の整合性を担保するためにエビデンスを歪めようとする動きがでることが懸念される(別のレポートで紹介したが、医療のEBMでは似たことが既に起きている)。私はエビデンスを真実性の問題だと思っているので(言い換えると、ある政策に効果があるかどうかについては掛け値のない本当のことを知りたいと思っているので)、こういう動きが広まらないことを願っている。

4.改めて効果とは何か-特に経済産業政策の場合

私の所属する独立行政法人経済産業研究所は経済産業省の所管下にあり、経済産業政策の効果について考えることが多い。

経済産業政策の効果については最近検証が行われており、中小企業庁の戦略的基盤技術高度化支援事業(「サポイン事業」と呼ばれている)についての委託調査報告書によれば、サポイン事業の採択企業は非採択企業と比べて年ベースで数億円から20億円ぐらいの売上高・出荷額の増加があり、十数%の増加率だったと指摘されている[14]。また、石井 芳明氏は、RIETIのコラムにおいて、中小企業基盤整備機構の実施するベンチャーファンド出資事業によって支援を受けた企業が支援を受けなかった類似の企業に比べて売上や従業員者数の伸びが大きかったと指摘している[15]。

これらの結果自体には異論はないのだが、これは果たしてこうした政策に効果があったことの本当の証拠になるのだろうか?

まず、資金援助を受けた企業が受けなかった企業に比べて売上や従業員数が多いということは、企業側としては受けとった資金の少なくとも一部を設備投資や雇用などの企業活動に充てたと推測できる。1000万円の補助金をもらったからその分だけ自己資金からの拠出を減らせば、企業は貯蓄を増やすだけでその行動に変化は起きず、資金援助を受けた企業と受けなかった企業との間で売上高や雇用に違いは生じないことになる。ところが、実際には資金援助を受けた企業の方が売上高や雇用は増えたわけだから、資金援助がより積極的な企業行動を促したことになる。その意味では、これらの助成措置は効果検証における第一関門を突破したことになる。

しかし、それだけで本当にこの政策に効果があると言いきれるだろうか。

たとえば、ある年に1000億円の国家予算を企業の設備投資や研究開発の支援に使うことにして、将来性があると見込まれる1万社に1000万円ずつ補助金を交付するとする。これは支出だけ見ると企業への支援だが、実際には所得の再分配で、国民1人当たり1000円ずつ税金として支払い、そのお金が1万社の企業に再配分されることになる。こういう政策に本当に効果があると言い得るためには、補助金を受領した企業の売上や雇用が受領しなかった企業に比べて増えただけでは足らず、もっと別なものが必要なのだろう。多くの人が納得しそうな効果としては、日本のGDPの増大、あるいは日本国民の1人当たり所得の増大、あるいは日本国民の平均的な幸福度の向上が考えられる。

ただ、このことの検証はほとんど不可能だ。理想的には日本のクローンのような国が何百もあって、それらをランダム化して、半分の国々ではこの補助金政策を実行して、半分の国々ではこの補助金政策を実行しないようにする。それでGDPや幸福度などの評価指標の変化について2つのグループで比較すればいい。しかしこれは現実にはできないし、仮にこのようなことができたとしても、日本のGDPは年間500兆円あるので、1000億円という金額は小さすぎて統計学的な検証では効果の検出は難しいだろう(おそらくは効果なしという結果になる)。

それではどうしたらいいかと言われても今の私にはわからないし、少々無責任であることは認めないといけないが、本当は念頭に置いておかないといけない話ではある。

5.おわりに

改めて最初に紹介したEBPMの定義を見てみる。

EBPM=個々の政策に実質的な効果があるかどうかを可能な限り厳密に検証して、実質的な効果があるという証拠があるものを優先的に実施しようとする態度

最後の「態度」という言葉だが、姿勢とか意欲とか気持ちといってもいいのかもしれない。EBPMというのは手法の問題ではなく、結局は個々の政策に本当に効果があるのかどうかを考えながら効果のあるものを重点的に行っていこうという姿勢・態度の問題である。少なくとも私はそう思っている。

個々の政策が厳密なエビデンスに基づかなくても、EBPMという態度をより多くの政治家や行政官が持つようになれば、それだけでも日本はもっと良い方向に変わっていくのではないか(ただしエビデンスはない)。その一方で、政策効果の有無に関するエビデンスを示すことは時間と労力のかかる大変な作業であり、またどんなに頑張ってもできないことが多く、ちょっとした分析や作文で解決する話ではないことも留意されるべきである。

謝辞

本レポートの執筆に当たり、小林 庸平氏及び森川 正之副所長から貴重なコメントをいただきました。深く御礼申し上げます。

脚注
  1. ^ WattsとMarstonはEBPMを明確に定義することが難しいとしている[16]。内山らは、「実験的・準実験的手法に基づいて明らかになった、施策に関する定量的な因果効果」を本来の意味でのエビデンスないし狭義のエビデンスとし、「インタビュー等に基づく定性的な因果関係や、シミュレーション分析の結果、データ・ファクト等」を含めたものを広義のエビデンスとして扱っている[17]。
引用文献
  1. 伊藤公一朗, 『データ分析の力―因果関係に迫る思考法』. 2017, 光文社新書.
  2. 中室牧子・津川友介, 『「原因と結果」の経済学 : データから真実を見抜く思考法』. 2017: ダイヤモンド社. 204p.
  3. Jørgensen, T., et al., Effect of screening and lifestyle counselling on incidence of ischaemic heart disease in general population: Inter99 randomised trial. Bmj, 2014. 348: p. g3617.
  4. 赤林英夫, 『幼児教育の無償化はマジックか?――日本の現状から出発した緻密な議論を』. SYNODOS, 2017.
  5. Pedersen, C.B., The Danish Civil Registration System. Scandinavian Journal of Public Health, 2011. 39(7_suppl): p. 22-25.
  6. Lynge, E., J.L. Sandegaard, and M. Rebolj, The Danish National Patient Register. Scandinavian Journal of Public Health, 2011. 39(7_suppl): p. 30-33.
  7. Simmons, R.K., et al., Effect of population screening for type 2 diabetes and cardiovascular risk factors on mortality rate and cardiovascular events: a controlled trial among 1,912,392 Danish adults. Diabetologia, 2017. 60(11): p. 2183-2191.
  8. Skaaby, T., T. Jørgensen, and A. Linneberg, Effects of invitation to participate in health surveys on the incidence of cardiovascular disease: a randomized general population study. International Journal of Epidemiology, 2017. 46(2): p. 603-611.
  9. Lindholt, J.S. and R. Søgaard, Population screening and intervention for vascular disease in Danish men (VIVA): a randomised controlled trial. The Lancet, 2017. 390(10109): p. 2256-2265.
  10. Ranganathan, P., C.S. Pramesh, and M. Buyse, Common pitfalls in statistical analysis: “No evidence of effect” versus “evidence of no effect” . Perspectives in Clinical Research, 2015. 6(1): p. 62-63.
  11. Manser, R., et al., Screening for lung cancer. The Cochrane Library, 2013.
  12. Oken, M.M., et al., Screening by chest radiograph and lung cancer mortality: the Prostate, Lung, Colorectal, and Ovarian (PLCO) randomized trial. Jama, 2011. 306(17): p. 1865-1873.
  13. Krogsbøll, L.T., et al., General health checks in adults for reducing morbidity and mortality from disease: Cochrane systematic review and meta-analysis. Bmj, 2012. 345: p. e7191.
  14. 三菱UFJリサーチ&コンサルティング株式会社, 『平成29年度戦略的基盤技術高度化支援事業の効果測定に関する調査事業 報告書 中小企業庁経営支援部技術・経営革新課委託調査』. 2018.
  15. 石井芳明, 「ベンチャー政策の評価とEBPMについて」. 独立行政法人経済産業研究所, 2017.
  16. Watts, R. and G. Marston, Tampering with the evidence: a critical appraisal of evidence-based policy-making. Australian review of public affairs, 2004. 3(3): p. 143-163.
  17. 内山融・小林庸平・田口壮輔・小池孝英, 「英国におけるエビデンスに基づく政策形成と日本への示唆-エビデンスの「需要」と「供給」に着目した分析-」. RIETI Policy Discussion Paper Series, 2018.

2018年10月17日掲載

この著者の記事