日本語タイトル:アルゴリズムは実験である:機械学習・市場設計・政策受益資格ルール

Algorithm is Experiment: Machine Learning, Market Design, and Policy Eligibility Rules

執筆者 成田 悠輔 (客員研究員)/矢田 紘平 (イェール大学)
発行日/NO. 2021年7月  21-E-057
ダウンロード/関連リンク

概要

アルゴリズムを利用した意思決定が爆増している。機械学習アルゴリズムから市場設計メカニズムや政策受益資格ルールまで、そしてビジネスから公共政策まで、アルゴリズムが雨後の筍状態だ。アルゴリズムによる意思決定は面白い性質を持つ。意思決定の出力が観察可能な入力変数のみに基づくため、入力変数に条件付ければ意思決定があたかも実験のようにランダムに行われるという性質だ。つまり、アルゴリズムの意思決定は自然実験であり操作変数である。私たちは、この観察を一般のアルゴリズムについて定式化し、アルゴリズムが自然に生成したデータから因果効果を推定する手法を提案する。主定理として、提案する推定量が一致性と漸近正規性を持つことを証明した。この結果の特殊ケースとして、回帰不連続デザインの高次元版も開発する。証明は微分幾何学と幾何学的測度論の手法に基づく。

提案手法の実性能も評価する。まず、機械学習アルゴリズムによる意思決定を模した高次元シミュレーションを行い、提案手法が他の手法より平均二乗誤差の点で優れていることを発見した。さらに、実政策応用として、米国でコロナウイルス対策に苦しむ病院への巨額の支援が行われたCARES Act(コロナウイルス支援・救済・経済安全保障法)の効果を分析した。この制度では、補助金の受給資格がアルゴリズム的ルールで決められため、提案手法を応用できる。分析の結果、補助金は病院の活動にほとんど影響を与えなかったことが分かった。提案手法は、PythonやRのパッケージで実装可能である。

概要(英語)

Algorithms produce a growing portion of decisions and recommendations both in policy and business. Such algorithmic decisions are natural experiments (conditionally quasi-randomly assigned instruments) since the algorithms make decisions based only on observable input variables. We use this observation to develop a treatment-effect estimator for a class of stochastic and deterministic algorithms. Our estimator is shown to be consistent and asymptotically normal for well-defined causal effects. A key special case of our estimator is a high-dimensional regression discontinuity design. The proofs use tools from differential geometry and geometric measure theory, which may be of independent interest.

The practical performance of our method is first demonstrated in a high-dimensional simulation resembling decision-making by machine learning algorithms. Our estimator has smaller mean squared errors compared to alternative estimators. We finally apply our estimator to evaluate the effect of the Coronavirus Aid, Relief, and Economic Security (CARES) Act, where more than $10 billion worth of relief funding is allocated to hospitals via an algorithmic rule. The estimates suggest that the relief funding has little effect on COVID-19-related hospital activity levels. Naive OLS and IV estimates exhibit substantial selection bias.