ノンテクニカルサマリー

内生的仲介変数がある場合についての性別あるいは人種の不平等の要素分解に関するディナード・フォーティン・レミュー手法の拡大

執筆者 山口 一男 (客員研究員)
ダウンロード/関連リンク

このノンテクニカルサマリーは、分析結果を踏まえつつ、政策的含意を中心に大胆に記述したもので、DP・PDPの一部分ではありません。分析内容の詳細はDP・PDP本文をお読みください。また、ここに述べられている見解は執筆者個人の責任で発表するものであり、所属する組織および(独)経済産業研究所としての見解を示すものではありません。

その他特別な研究成果(所属プロジェクトなし)

本論文の主題は、不平等の要素分解に関する統計的分析方法の改良である。計量経済学における不平等の要素分解手法の代表にブリンダー・オアハカ分解手法(BO手法)がある。これは男女の所得の不平等を例にすると、所得についてたとえば教育や就業年数など人的資本の変数や、勤め先の企業の特徴などを説明変数とする回帰分析の式をまず男女別に仮定する。この場合たとえば女性が男性と同じ説明変数の分布を持っていたならばという反事実的状況は、男性の説明変数と女性の回帰係数を組み合わせた形になる。それを用いて男女の説明変数の違いで説明できる所得格差と、説明できない所得格差に分解するのがBO手法である。

BO手法に代わる不平等の分解手法のより新しい方法にディナード・フォーティン・レミュー手法(DFL手法)がある。DFL手法では、回帰式を一切仮定しない。この場合たとえば女性が男性と同じ共変数の分布を持つという反事実的状況は、下記の図1において、性別の変数Xと共変数Vが統計的に独立になり(図1では点線で表されているXのVへの影響を取り除き)、それが女性が男性と同じ共変数の分布を持つという状態になることで達成される。これは女性の共変数の分布を分母とし、男性の共変数の分布を分子とする比で表せられるウェイトを各標本観察値に掛けることで達成できるが、DFL手法は、統計的因果分析の開発で有名なルービンの用いた傾向スコアを用いると、このウェイトの推定が可能であるという事実に基づいている。

図1:仮定する影響の図式
図1:仮定する影響の図式
注:Xは性別、Vは結果の説明変数、Yは結果を表す。DFL手法はXのYへの影響についてVを通さない直接的影響(説明できない不平等)とVを通した間接的影響(説明できる不平等)に回帰モデルを用いずに分解することが目的である。

しかし、方法論的にBO手法も、DFL手法も、観察されない結果(上記の例では所得)の決定要因は、要素分解に用いる説明変数と独立であるという、「説明変数の外生性」の仮定を置いている。本稿の主たる目的は、図1のVが内生性である(観察されないYの決定要因と独立でない)場合についてのDFL法の特徴と、結果として説明変数の内生性は、推定値にバイアスをもたらす可能性が高いことを示し、その場合にどのようにしてそのバイアスを取り除くかに関係する新たな統計的方法を開発し提唱することにある。

説明変数の内生性のもたらす問題の理解のために単純化した具体例を挙げると、仮に何も制御しない場合に所得に影響する男女の潜在能力(観察されない変数)の分布は異ならないとする。しかし潜在能力は学歴に影響し(つまり学歴は内生変数であり)、男女の間に学歴差があるとする。単純化のために仮に男性の50%、女性の30%が大卒で、それぞれ潜在能力の高い順に大卒になるとする。すると、学歴を制御すると(学歴別にみると)、大卒の男女の間でも、大卒未満の男女の間でも女性の潜在能力は男性の能力より平均的に高くなる。なぜなら大卒の場合には男性は潜在能力が上から50%の平均となり、女性は上から30%の平均になるからで、また大卒未満の場合でも、男性は下から50%の平均であるのに対し、女性は下から70%の平均となるからである。この結果学歴を制御すると性別と潜在能力の間に相関が生じる。論文では、このような観察されない決定要因(たとえば潜在能力)と性別との相関が、説明変数を制御することで生じると、DFL法の要素分解分析結果には偏りが生じ、またその偏りを取り去ることが必要となることを示す。

本稿では、このような相関を取り除く手法であるヘックマンの2段階推定法とDFL手法を結びつける新たな手法を、上記の偏りの有無の検定と、偏りがある場合の除去の方法について提唱している。ただし、ヘックマンのこの手法は元来回帰分析と結びついて提案されたものであり、DFL手法は回帰分析ではないので直接結び付けることはできない。このため本稿は既存のヘックマン手法そのものではなく、その方法の元にある考えとDFL手法を結びつけることで、新たな手法を開発し提唱しているのである。

また本稿においては性別や人種といった時間とともに変わらない変数の影響についての因果分析について新たな考えを導入している。パネルデータ分析における統計的因果分析手法では、因果的影響をもたらす変数は通常時間とともに変わる変数で、このため性別や人種の影響などについては、因果分析は不可能と誤って考えられてきた。実際個人別の観察されない固定効果を仮定するモデルでは、性別や人種の影響は計測できない。またXが性別や人種を表すなら、Xは「因果的処理」の影響を受けたグループ(処理群)と受けなかったグループ(制御群)の区別ではない。しかし、本稿はDFL手法をルービンの因果モデルから再構築することにより、性別や人種を表すXの影響も「処理を受けなかった人の間での平均処理効果」(Average treatment effect for the untreated)とみなすことができ、DFL手法をその効果を推定する方法として再構築を行っている。

応用については経済産業研究所「仕事と生活の調和(ワーク・ライフ・バランス)に関する国際比較調査」(2009年)の企業・雇用者のデータを用い、ホワイトカラーの正規雇用の男女の所得格差を、男女の年齢、学歴、勤続年数の違いによって説明できる部分と説明できない部分に分解し、またその分解結果が有配偶男女と無配偶男女ではいかに異なるかを分析している。