自己選択と機械学習の手法を活用し、最適な政策ターゲティングを実現する

伊藤 公一朗
客員研究員

ターゲティングは、経済学や政策設計の中心的な問題になっている。政策立案者が予算制約に直面したとき、政策の適切な受益者を特定することは、政策効果を最大化するために重要である。機械学習や計量経済学的手法の進歩により、職業訓練プログラム(Kitagawa and Tetenov, 2018)、社会的セーフティネットプログラム(Finkelstein and Notowidigdo, 2019; Deshpande and Li, 2019)、エネルギー効率化プログラム(Burlig, Knittel, Rapson, Reguant, and Wolfram, 2020)、節電のための行動ナッジ(Knittel and Stolper, 2021)、エネルギーのダイナミックプライシング(Ito, Ida, and Takana , forthcoming)など、多くの政策領域でターゲティングに関する研究が急増している。

一般的に使用される2つのアプローチ:自己選択によるターゲティング、観測データによるターゲティング

経済学者は一般に、効果的なターゲティングの設計について、2つの特徴的なアプローチの使用を考慮する。第一のアプローチは、観測可能な特性に基づくものである。このアプローチでは、政策立案者は個々人の観測可能なデータを用いて、最適なターゲティングを探る(Kitagawa and Tetenov, 2018; Athey and Wager, 2021)。第二のアプローチは、自己選択に基づくものである。このアプローチでは、政策立案者は、特定の個人のタイプをターゲティングする際に、個々人の自己選択を貴重な情報と見なす(Heckman and Vytlacil, 2005; Heckman, 2010; Alatas, Purnamasari, Wai-Poi, Banerjee, Olken, and Hanna, 2016; Ito, Ida, and Takana, forthcoming)。 政策立案者にとってどちらのアプローチが望ましいかは、事前には不明である。例えば、Manski (2013)は上記の2つの特徴的なアプローチを「計画者の決定」、「自由放任」とそれぞれ名付け、下記のようにまとめている。

「要するに、個人は計画者よりも情報が豊富で、それゆえより良い決定を下すという大まかな主張には懐疑的であるべきである。もちろん、このような主張に対する懐疑は、計画が自由放任よりも効果的であることを意味するものではない。両者の相対的なメリットは、選択の問題の特殊性に左右されるのである。」
-Charles F. Manski, Public Policy in an Uncertain World

以上の引用文に反映されているように、適切なアプローチは文脈によって異なるため、研究者や政策立案者はケース・バイ・ケースでどちらを使用するかを決める必要があるというのが、この文献に共通する見解である。

われわれの新しい発想:従来の2つのアプローチを最適に統合する手法の開発

われわれの新しい研究、"Choosing Who Chooses: Selection-Driven Targeting in Energy Rebate Programs"(Takanori Ida, Takunori Ishihara, Koichiro Ito, Daido Kido, Toru Kitagawa, Shosei Sakaguchi, and Shusaku Sasaki)においては、経済学でよく使用されるそうした2つの特徴的なアプローチを体系的に統合させた最適な政策割り当てのルールを開発する。

社会厚生の増加が個人間で不均一であり、誰が恩恵を受けるかによって、正、負、ゼロのいずれかになるような処置を考慮する。われわれは、政策立案者が観測可能な特性に基づいて3種類の個人を識別することにより、観測可能な情報と観測不可能な情報の両方を活用することができるということ考える。

政策立案者が予算制約に直面する際、社会的セーフティネットプログラムからエネルギー効率化インセンティブまでさまざまな経済政策において、誰が政策介入の恩恵を受けるべきかを特定することは、政策の成功に不可欠である。プログラムの対象をどのように特定するかは、一般に、所得などの観測可能な特性に基づいて参加できる人を選択する方法と、人々に自己選択させる方法の2つがある。本論文では、この2つのアプローチを最適に統合するデータ駆動型の手法を開発した。

われわれはこの方法を、環境省と共同で行ったフィールド実験に適用し、家庭用電力のリベートプログラムに最適な目標設定方法を決定した。このリベートプログラムの目的は、電力コストが非ピーク時よりも大幅に高くなる傾向があるピーク需要時間帯の省エネにインセンティブを与えることである。この場合、節電には社会的(家計的)なメリットがあるが、政策の実施には政府支出と家計の利便性の両面からコストがかかる。従って、消費者から得られる正味の厚生利得は、正、負、ゼロのいずれにもなり得る。われわれは、3,870世帯を、リベートプログラムへの強制参加、プログラムへの強制不参加、自己選択(つまり、このグループの世帯は参加するかどうかを自分で決めるよう求められた)の3つのグループにランダムに割り振った。

フィールド実験により、新手法の優位性が示された

フィールド実験のデータを用いて、政策の最適なターゲティング方法、そのターゲティングが政策の成功に与える影響、参加した人と参加しなかった人への政策の影響を推定した。

下記の表(論文のTable 3)では、ターゲティングなしの3つのベンチマーク政策(100% 非処置、100% 処置、100% 自己選択)の厚生のパフォーマンスを示し、次に、準最適、最適ターゲティング政策(選択不在型ターゲティング、選択駆動型ターゲティング)を示した。

Table 3: Welfare Gains from Each Policy
Table 1: Welfare Gains from Each Policy
Notes: This table summarizes characteristics of three benchmark policies (100% untreated, 100% treated, and 100% self-selection), selection-absent targeting (Ĝ), and selection-driven targeting (Ĝ*). The column titled “Welfare Gain” shows the estimated ITT of welfare gain in JPY per household per season, with its standard error in parentheses. The monetary unit is given as 1 ¢ = 1 JPY in the summer of 2020.

各政策について、1シーズンあたり1世帯あたりの厚生利得を円単位でITT推定した。その結果、100%処置の政策は消費者1人あたり120.7円の厚生利得をもたらすが、その効果は統計的に有意ではない。100%自己選択政策では、消費者1人あたり180.6円の福祉利益が得られ、p値=0.107でわずかに有意であった。これらの結果は、以下のことを示唆している。つまり、ターゲティングを行わなければ、この政策の正味の厚生利得がゼロになる可能性は否定できない。

この政策介入は、コスト(実施コスト)と(省エネルギーによる)メリットの両方を誘発するため、消費者の正味の厚生利得は正、負、あるいはゼロとなり得ることを想起してほしい。このことは、ターゲティング政策によって政策パフォーマンスを向上させられる可能性を意味している。

表中の結果は、選択不在のターゲティングが消費者1人あたり387.8ドルの厚生利得を達成することを示唆している。われわれのアルゴリズムは、52.4%の消費者が政策的処置の対象となり、47.6%の消費者が処置の対象とならないことを特定した。さらに、選択駆動型ターゲティングは、消費者1人あたり553.7%の厚生利得をもたらすことが分かった。この政策では、われわれのアルゴリズムは、31.4%の消費者が処置の対象となり、23.9%の消費者が処置の対象とならず、44.7%の消費者が自己選択をすべきであると特定した。

下記の表(論文のTable 4)では、ある政策の厚生利得が他の政策の厚生利得より大きいという帰無仮説を統計的に検証している。100%Sは100%Tよりも大きな厚生利得を生み出すが、その差は統計的に有意ではない(p値は0.29)。ターゲティング政策(G†とG*)は、いずれもノンターゲティング政策よりも統計的に大きな厚生利得を生み出す。最後に、選択駆動型ターゲティング(G*)は、選択不在型ターゲティング(G†)よりも43%(=553.7/387.8 - 1)大きな厚生利得をもたらし、その差はp値0.003で統計的に有意であることが分かった。

Table 4: Comparisons of Alternative Policies
Table 2: Comparisons of Alternative Policies
Notes: This table compares welfare gains from each policy. For each row, the column “Difference in Welfare Gains” shows the estimated welfare gain of the policy on the left-hand side (WL) relative to the policy on the right-hand side (WR) in JPY per household per season, with its standard error in parenthesis. The column “p-value” gives the p-value for the null hypothesis: H0 : WL ≥ WR. The monetary unit is given as 1 ¢ = 1 JPY in the summer of 2020.

われわれの手法は、効率性と公平性を両立させる政策に適用することができる

政策の効率性は重要であるが、政策が公平性も重要である。われわれは、以上の枠組みが功利主義的な社会厚生関数に限定されないということを強調する。この点を明らかにするために、公平性と効率性のトレードオフを均衡する社会厚生関数を検討する。われわれは、Saez(2002)によって開発され、Allcott, Lockwood, and Taubinsky(2019)およびLockwood(2020)で使用されている枠組みを使用する。この枠組みでは、計画者は公平性と効率性のトレードオフの均衡を図るため、社会的厚生関数にパレート加重を含めることができる。われわれは、以上の方法が、程度の異なる再分配目標に対する、最適なターゲティングを定量化できるということを実証する。この方法により、計画者は、効率性の向上の犠牲と引き換えに、政策の公平性を向上させることができる。われわれは、再分配目標を考慮してもなお、選択駆動型ターゲティングが選択不在型ターゲティングより優れていることを見いだした。

下記の表(論文のTable 7)では、世帯の所得分布にわたって消費者に分配されるであろうリベートの平均を比較する。最適な政策は、高所得世帯により多くのリベートを分配することが分かる。つまり、このターゲティングは政策からの効率的利得を最大化するが、公平性に関心を持つ政策立案者には魅力的でない可能性がある。この公平性の懸念に対処するため、われわれは公平性と効率性のトレードオフの均衡を図る方法も提供する。われわれは、条件を満たした世帯に参加を選択させる方が、条件を満たした世帯すべてに自動的に参加させるよりも、なお効率的であり、より公平であることを見いだした。

Table 7: Incorporating Equity-Efficiency Trade-off
Table 3: Incorporating Equity-Efficiency Trade-off
Notes: The first column “Efficiency gain” shows the welfare gain from the policy measured by the utilitarian welfare function. Other columns present the average rebate amount in each of the quartile of the income distribution. The utilitarian policy maximizes the efficiency gain but its rebate distributions are regressive. In Section 6, we consider a welfare function with a redistribution goal with a Pareto parameter ν. The policies with ν = 1 and 2 reduce regressivity at the cost of sacrificing the efficiency gain. The monetary unit is given as 1 ¢ = 1 JPY in the summer of 2020.

本コラムの原文(英語:2023年2月7日掲載)を読む

参考文献
  • ALLCOTT, H., B. B. LOCKWOOD, AND D. TAUBINSKY (2019): “Regressive sin taxes, with an application to the optimal soda tax,” The Quarterly Journal of Economics, 134, 1557–1626.
  • ATHEY, S. and S. WAGER (2021): “Efficient policy learning with observational data,” Econometrica, 89, 133–161.
  • BURLIG, F., C. KNITTEL, D. RAPSON, M. REGUANT, and C. WOLFRAM (2020): “Machine learning from schools about energy efficiency,” Journal of the Association of Environmental and Resource Economists, 7, 1181–1217.
  • DESHPANDE, M. and Y. LI (2019): “Who Is Screened Out? Application Costs and the Targeting of Disability Programs,” American Economic Journal: Economic Policy, 11, 213–248.
  • FINKELSTEIN, A. and M. J. NOTOWIDIGDO (2019): “Take-up and Targeting: Experimental Evidence from SNAP,” Quarterly Journal of Economics, 134, 1505–1556.
  • HECKMAN, J. J. (2010): “Building Bridges between Structural and Program Evaluation Approaches to Evaluating Policy,” Journal of Economic Literature, 48, 356–398.
  • HECKMAN, J. J. and E. VYTLACIL (2005): “Structural Equations, Treatment Effects, and Econometric Policy Evaluation,” Econometrica, 73, 669–738.
  • ITO, K., T. IDA, and M. TAKANA (forthcoming): “Selection on Welfare Gains: Experimental Evidence from Electricity Plan Choice,” American Economic Review.
  • KITAGAWA, T. and A. TETENOV (2018): “Who should be treated? Empirical welfare maximization methods for treatment choice,” Econometrica, 86, 591–616.
  • KNITTEL, C. R. and S. STOLPER (2021): “Machine Learning about Treatment Effect Heterogeneity: The Case of Household Energy Use,” AEA Papers and Proceedings, 111, 440–44.
  • LOCKWOOD, B. B. (2020): “Optimal income taxation with present bias,” American Economic Journal: Economic Policy, 12, 298–327.
  • MANSKI, C. (2013): Public Policy in an Uncertain World, Cambridge, MA: Harvard University Press.
  • SAEZ, E. (2002): “Optimal income transfer programs: intensive versus extensive labor supply responses,” The Quarterly Journal of Economics, 117, 1039–1073.

2023年2月15日掲載