政策効果を測定すること

小西 葉子
研究員

政策効果を測定すること

現状に問題点や改善の余地があるとき、政府は適当な政策をとることによりその改善をはかる。たとえば経済について、GDPのコントロールのためには税の導入や税率の変更、為替レートの安定のために為替市場介入、失業率の減少のためにハローワークでの職業訓練などが挙げられる。経済学では、ターゲットとなる経済事象が政策変数を変動させることによってどのように変化するかを経済理論などから予想して経済政策の効果を分析する。当然、その後実際に経済政策が機能して、期待通りの成果が得られたのかを調べることは当該政策の評価や今後の政策立案にとって非常に重要である。政策により、どれだけ経済事象が変化したかは政策効果、プログラム効果などと呼ばれる。政策評価のみならず、他にも本質的に同じ問題は日常に数多くある。たとえば投薬により投薬しない場合よりどれだけ症状が改善したか、運動によるダイエット効果はあるのか、授業の補習をした結果、しなかった場合と比較してどれだけ成績が上がったのか、大学教育を受けたことにより生涯賃金がどれくらい変わるかなどである。一般にある行為や介入の効果をトリートメント効果といい、その効果を正確に測ることは重要な問題であり、近年経済学では理論や手法が開発され労働経済学や開発経済学等で多く実証研究が行われている。個人ベースでデータが集められるケースでも効果の評価は簡単ではないが、GDP、為替レートといったマクロ経済政策の分析では、結果のデータが1つしかないためさらに難しい問題となる。

サンプルセレクションを身近な例で考えてみよう

政策評価に限らず、一般にある行為や介入(トリートメント)について、その効果を正確に測ることは簡単なことではない。身近な例を挙げて、受験の合否と合格祈願効果について考えてみよう。受験生にお参りしたかどうかと、受験の合否を尋ねたとしよう。お参りした人の合格率が40%、しなかった人の合格率は60%だったとする。来年受験のAさんは、「お参りの効果はないか、むしろ逆効果だからやめておこう」と強く思った。この考えは正しいだろうか?

ここでわたしたちは、何が観察されているのかを注視する必要がある。もし、ある受験生について、お参りしたときとしなかったときの両方の合否が観察され、お参りしたときのみ合格なら、お参りの効果があったと結論づけられるだろう。しかし通常私たちが観察できるのは、お参りした人と、しなかった人のそれぞれの結果のみであり、直接各個人についてお参りの効果を調べることができない。 この問題は欠損値問題とよばれ、投薬、教育、職業訓練などの効果を測るケースでも起こる。

さらにもう1つ、どんなタイプ(属性)のひとたちがお参りをしたかも重要である。もし、(1)信心深い人、(2)あまり勉強せず自信がないので神頼みになった人、(3)友達に誘われた人がお参りしたとする。(1)と(3)は成績と関係ないかもしれないが、(2)は明らかに成績と関係があるだろう。つまり、合格しにくい人がお参りし、勉強に十分時間を割いて神頼みに行く時間がない人がお参りしなかったのかもしれない。このように、お参りするという行動に合否に影響を与える成績に関する傾向がみられるとき、お参りのご利益効果を正確に計れない。合格しやすい人もしにくい人も満遍なく(ランダムに)お参りしていれば、このような問題は起こらない。しかし、お参りするかどうかは自分で決めるため、お参りする人と、しない人の属性に偏りが生じることがある。このような偏りのことをサンプルセレクションバイアスといい、このとき、結果のデータの単純比較ができなくなる。

政策評価の手法紹介

政策効果やトリートメント効果を計るとき、サンプルセレクションがなく、満遍なくいろんな人が介入を受けたり、受けなかったりしている場合は、介入を受けた「介入グループ」と受けなかった「対照グループ」の平均の差を調べればよい。

一方、欠損値やサンプルセレクション問題があってデータがランダムでない場合には、得られたデータの形態に応じて、(1)マッチング、(2)Before-After、(3)差の差(Difference in difference: DID)等の計算方法を用いて効果を測定する。以下で詳しくみてみよう。

(1)マッチングは、先の受験と合格祈願の例のように介入後の結果のデータのみある場合の計測方法である。ある行為を行った「介入グループ」と行わなかった「対照グループ」から属性の似たもの同士を取り出して、それぞれの平均を比較する。たとえばお参りしたグループとしなかったグループから、入試直前の模擬試験の結果がほぼ同じ人のみを取り出して合格率を比較することにより、同一人物が介入を受けた時と受けなかった時の比較に近い状況を作り、参拝効果を計測する。

(2)Before-Afterは、介入前後のデータがある場合に用いられる方法である。同じ対象が介入前後でどのように変化したかを調べることによって効果を求める。たとえば、職業訓練の給与に与える効果を計る際に、訓練を受けた人のみ取り出して、訓練前後の給与の平均を比較する。この方法は非常によく用いられるが、1つ問題があり、皆に共通の変動(景気変動、災害、異常気象など)が起きた場合に、その効果も結果に含まれてしまう。たとえばたまたま訓練期間中に景気が好転するような場合、景気好転による給与上昇分が含まれてしまって職業訓練効果は過大に推計される。

(3)差の差(Difference in difference: DID)は、介入前後のデータと対照グループのデータがある場合に用いる。これは「マッチング」と「Before-After」の組み合わせと考えることができ、介入グループの職業訓練前後の給与変化と対照グループの同時期の変化の差を計算する。つまり、先の職業訓練による給与上昇効果の例では、Before-Afterで求めた給与上昇分から同時期の景気好転による給与のアップの影響を除去できる。

こういった手法を適用できる研究対象は、中小企業への租税特別措置の効果、輸出振興政策の効果、電力料金引き上げの影響、失業給付の効果、教育システムの効果、貧困救済プログラムの効果など多岐に渡る。このような国の政策については内容を理解し、評価すること自体が非常に重要で関心が高いため、日々マスメディア等でもとりあげられている。もちろん各メディアとも解釈について種々の解説が付されているが、重要な視点として欠損値問題とサンプルセレクションが起こっていないかに注目し、できれば自分なりにも解釈し、意識して疑問を持つことにより、経済状況や政治への理解が深まることを期待する。

2011年8月9日

投稿意見を読む

2011年8月9日掲載