行政業務データの研究利用でひろがる可能性

近藤 絢子
ファカルティフェロー

課税額の算定に必要な所得などの情報(税務情報)や各種行政サービスの利用記録など、国や地方自治体の業務記録である行政業務データは、対象とする母集団全体をカバーし記載内容が正確であるため、学術的な利用価値も高い。このため、経済学をはじめとする社会科学の実証分析における行政業務データの活用は、国際的にみればここ数十年にわたって、社会のICT化の進展とともに趨勢的に拡大してきた。その一方で、日本では行政業務データの学術利用はごく最近まで非常に限られており、欧米に比べた研究水準の低下の一因にもなっていた。しかし近年、EBPM(Evidence based policy makingエビデンスに基づく政策立案)への関心の高まりから、日本においてもようやく、行政業務データの研究利用を進める動きが加速しつつある。

例えば、東京大学政策評価研究教育センターでは、2021年より「EBPM推進のための自治体税務データ活用プロジェクト」を立ち上げ、地方自治体から提供された税務データを研究利用できるような仕組みを作ろうとしている。筆者がリーダーを務めるRIETIプロジェクト「子育て世代や子供をめぐる諸制度や外的環境要因の影響評価」も、このプロジェクトから個人住民税に関する税務データの提供を受けて、出産前後の女性の収入の変化や、既婚女性の就労調整の実態把握等に用いる予定である。

また、医療経済学では保険診療のレセプトデータを使った研究がすでに日本でも数多く行われ、国際的にも注目を集めた論文も多い(最近ではIizuka and Shigeoka, forthcomingなど)。教育経済学でも、特定の自治体と協力してその自治体独自の教育行政データベースを構築し、学力テストや出席日数等と学校やクラス、教員の情報を接合して分析する試みが広がりつつある(別所他2019, Oikawa et al, forthcomingなど)。

行政業務データの活用で分かることの例

筆者の専門とする労働経済学の分野で、行政業務データの活用による実証研究の進展が特に期待できるテーマの1つが、家族形成や子育て世代の労働供給分析だ。結婚や出産、離婚などといった家族構成の変化は住民基本台帳によって確実に把握できるし、給与収入などから労働供給もある程度は把握できる。そこへ、国や地方自治体が行っている、子育て支援のためのさまざまな制度・政策の利用記録を接合することによって、それぞれの制度・政策について女性の社会参加や少子化の緩和にどのくらい効果があったのかを検証することができる。EBPMのための政策評価の典型例ともいえる。

具体的な例を挙げると、前述のRIETIプロジェクト「子育て世代や子供をめぐる諸制度や外的環境要因の影響評価」では、地方自治体から提供された税務データを利用して、出産前後の女性の収入の変化、いわゆるChild Penaltyをまず正確に測定する。そのうえで、Child Penaltyの大きさに影響する要因を探索することにしている。

実は、第一段階であるChild Penaltyの大きさの把握すら、これまで日本ではデータの制約が厳しく、信頼できる推計がほとんど行われてこなかった。という話をすると、「そもそも日本にはパネル調査が存在しないから」と言い出す人がいるが、それはさすがに昔の話であり、大学等が提供する研究利用可能なパネル調査は20年前に比べれば確実に増えたことはあえて指摘しておきたい。しかし、大学等が行う調査ではサンプルサイズがそれほど大きくないことや、回答者に自己申告させる形式では所得の正確な把握が難しいこと、さらにはパネル調査においては家族構成の変化をきっかけとして脱落確率が上がってしまうことを考えると、Child Penaltyの正確な測定には、住民登録のある全世帯の出生情報を把握できる行政業務データの利用が不可欠である。

第二段階であるChild Penaltyの大きさに影響する要因としては、家族構成や夫の収入などの個人要因のほか、保育所の入りやすさや、産業構造や需給バランス等労働市場の特性などといった地域要因が考えられる。地域要因のなかでも、とりわけ子育て支援政策に関する情報は、同じ自治体が把握していることが多い。もしそうした情報を追加で得られれば、個別の具体的な政策によって、どの程度Child Penaltyが緩和されたかが評価できる。例えば、保育所に入れた世帯と入れなかった世帯で長期的にどのような差が出るか、学童保育はどうか、などが分かれば、今後の制度設計にも有用な知見となる。

行政業務データとサーベイデータそれぞれに長所がある

行政業務データの活用によってはじめて可能となる実証研究は数多くある。その一方で、国勢調査や労働力調査といった直接的な調査に基づくサーベイデータにも行政業務データにはない長所がある。どれだけ行政業務データの研究利用が進んだとしても、サーベイデータの整備・維持は依然として非常に重要であることを、最後に改めて指摘しておきたい。

行政業務データ最大の欠点は、業務に必要でない情報が含まれない点だ。例えば、ほとんどのサーベイデータで尋ねている最終学歴は、税務をはじめほとんどの行政業務の遂行上必要ない情報であり、行政業務データに含まれることはめったにない。

また、少なくとも日本の現状では、データを持っている主体をまたいで情報を接続することが非常に難しいという問題もある。例えば、地方自治体が持っているデータは、住民基本台帳と容易に紐づけられるため全住民をカバーすることができる一方、仕事に関して所得以外の情報がほとんどない。自営業かサラリーマンか程度は主な収入の種類から類推できるが、勤務先の業種・職種や雇用形態などは自治体が把握していないため分からない。雇用保険や厚生年金などの被用者対象の社会保険加入者のデータと紐づけることができればこの点は解決できるし、実際に北欧等ではそうした研究がすでに行われている。しかし日本でそうしたデータを構築するためには、技術的にも制度的にも超えなければならないハードルがまだいくつも残っている。

サーベイデータは、データを集めること自体を目的として調査をするので、質問項目を自由に設定できるという強みがある。加えて、行政業務データの活用が地方自治体を中心に行われている現状では、日本全体の傾向を把握するには、国勢調査や労働力調査などの全国をカバーする大規模な政府統計がやはり欠かせない。日本は政府統計の二次利用申請手続きの煩雑さや使い勝手の面でも課題が多い。行政業務データ、サーベイデータ共に、研究利用のためのアクセスがより一層改善されていくことが望まれる。

参考文献
  • Iizuka, Toshiaki and Hitoshi Shigeoka (forthcoming) “Is Zero a Special Price? Evidence from Child Healthcare”. American Economic Journal: Applied Economics.
  • Oikawa, M., R. Tanaka, S. Bessho and H. Noguchi(forthcoming)“Do Class Size Reductions Protect Students from Infectious Disease? Lessons for Covid-19 Policy from Flu Epidemic in Tokyo Metropolitan Area,” American Journal of Health Economics.
    RIETI DP version: https://www.rieti.go.jp/jp/publications/summary/22050001.html
  • 別所俊一郎・野口晴子・田中隆一・牛島光一・川村顕(2019)「子どもについての行政データベースの構築」『フィナンシャル・レビュー』第 141 号,pp. 106-119.

2022年10月3日掲載

この著者の記事