ノンテクニカルサマリー

日本の高齢労働者における過剰就業と不完全(過少)雇用の決定要因を解明する:機械学習によるアプローチ

執筆者 張 美蓮(香港中文大学)/殷 婷(研究員(特任))/臼井 恵美子(一橋大学)/小塩 隆士(一橋大学)/張 億(中央金融経済大学)
研究プロジェクト コロナ禍における日中少子高齢化問題に関する経済分析
ダウンロード/関連リンク

このノンテクニカルサマリーは、分析結果を踏まえつつ、政策的含意を中心に大胆に記述したもので、DP・PDPの一部分ではありません。分析内容の詳細はDP・PDP本文をお読みください。また、ここに述べられている見解は執筆者個人の責任で発表するものであり、所属する組織および(独)経済産業研究所としての見解を示すものではありません。

人的資本プログラム(第五期:2020〜2023年度)
「コロナ禍における日中少子高齢化問題に関する経済分析」プロジェクト

背景

個人が労働時間と年金受給可能年齢を最適に選択する新古典派モデルでは、一般に若年労働者と高齢労働者の間に「過剰就業」(つまり、より短い労働時間が望ましいこと)も「過少就業」(より長く働きたいこと)もないと予測される。しかし、現実には、就業の過剰と過少が蔓延していることが米国、オーストラリア、欧州諸国及び中国の多くの先行研究によって検証されてきた。高齢男性労働者の高い労働参加率で知られている日本もこの点については例外ではない。Hara and Sato (2008)は日本の労働者の45%が過剰就業で、6%が過少就業であると報告している。 Usui et al. (2016) によると、年金受給年齢の男性自営業者は過剰就業の傾向がある一方、給与所得者は過少就業の傾向が見られる。また、過少就業や過剰就業の決定要因を検証する方法には様々なものがあり、先行研究の大半は若年層や労働年齢人口に焦点を当て、ロジスティック回帰やプロビット回帰(注1)といった計量分析の手法を用いて、事前に想定された一連の変数と過剰就業や過少就業の発生率との関係を検証している。

しかしながら、実際に労働時間のミスマッチがもたらす悪影響をより受けやすい高齢労働者に焦点を当てた研究は少ない。特に高齢化が世界中で加速している現在、高齢労働者の過剰就業と過少就業に影響を与える要因の理解を深めるためのより多くのエビデンスが必要となっている。過少就業も過剰就業も、特に高齢労働者にとっては厚生(well-being)の損失を引き起こすことがある。具体的には、過少就業は隠れた失業とも呼ばれ、人的資源の活用不足、十分な収入・年金に対する期待の未達成、仕事に対する低い満足度に繋がる一方、過剰就業は、ワークライフバランスの崩壊、欠勤の増加、主観的厚生の低下、メンタルヘルスの悪化、さらに過労死を引き起こすことが多くの先行研究から分かった。したがって研究者や政策立案者にとって、過少就業や過剰就業の決定要因を知ることは喫緊の課題となっている。

本稿の趣旨及び分析結果

本稿では、data-driven approach,すなわち、重要な変数の省略をさけるアプローチを革新的に使用する。言い換えると、先行研究で使用された変数に拘らず、Random Forest, XG-Boost及び, Lasso(注2)という機械学習手法を活用し、幅広い候補となる変数の選択を行う。また、クロスバリデーション(注3)により、最良のモデルと最も重要な特徴を選択した。そして全サンプルとサブサンプルについてロジスティック回帰を用いて、日本の高齢労働者の過剰就業と過少雇用を促進する重要な要因を突き止める。さらに K-means クラスタリング(注4)を用いて、過剰就業と過少就業者の中に異なる潜在グループが存在するかを検証した上で、年齢、性別、雇用形態に基づく異質性の結果を探る。

その結果、1)より良い経済状況、より悪い健康状態、より少ない家族支援、不利な職務特性を持っている人は、過剰就業を報告する可能性が高く、一方、2)年齢との間にU字型の関係があること、より少ない可処分所得、現在の労働時間の短さ、不安定な仕事、および低い職務満足度と給与満足度は、過少就業を予測することが分かった。

また、過剰就業と過少就業の労働者の中に異質なグループが存在するかどうかを明らかにするために、K-meanクラスタリング法を用いて、過剰就業と過少就業という条件付きで潜在的クラスターを特定した。

図は主成分分析(PCA)によって取得された最も重要な2次元の主成分1と主成分2平面上にクラスターをプロットしたものである。この図によると、1)過剰就業者は、①自営業者でかつ高齢者であり、健康状態が悪く教育水準が低い者、また②独身で子供が少なく、高齢の親の面倒をみる必要が少ないなど、家族の支援や責任が少ない者、さらに③可処分所得が多く比較的若い者の3つのグループがあることが分かる。一方、2)過少就業者は、①若年で給与所得があり、介護負担が重い者、②健康状態の悪い高齢者、③貧しい高齢者という3つのグループから構成されている。このような異質なクラスターは、労働者が異なる理由によって過剰就業や過少就業に陥っていることを示唆している。

さらに、これまでの文献では、男性対女性、給与所得者対自営業者は過剰あるいは過少就業の決定要因において異質的でありうることが示されていたが、年齢、性別、雇用形態による異質性分析は必ずしも行われていなかった。本研究での異質性分析によると、①経済的ストレスに直面し、家族のサポートが不足している65歳以上の労働者、②不安定な仕事をもつ女性と低い配偶者所得を抱える女性、③十分な労働時間が確保されていない給与所得労働者において、労働促進政策の余地があることが示唆された。

政策インプリケーション

本研究から得られた重要な点は、少なくとも、①経済的ストレスや家族のサポート不足に直面している65歳以上の労働者、②不安定な仕事をもつ女性や低い配偶者収入を抱える女性、③十分な労働時間が確保されていない給与所得労働者には、労働供給を促進する余地が大いにあることである。

一方、労働者の労働時間短縮のニーズとのバランスを慎重にとる必要がある。また、疾病に苦しむ高齢労働者への経済的支援、手厚い医療保険へのアクセス向上、自営業者の保険料負担支援、女性労働者の柔軟な勤務形態などは、過剰就業による苦痛を軽減するためのもっとも妥当な政策手段だと考えられる。

最後に過剰就業と過少就業問題をセットで考えるべきである。高齢労働者の労働時間を延長すると、若年層や女性の雇用機会が失われる可能性があるためである。そのためには、政策立案者は、労働時間がミスマッチしているグループ内の異質なインセンティブや課題を意識しながら、政策措置がサブグループに波及する可能性に常に注意を払うべきだと考えられる。

図:主成分分析による2次元の主成分に沿ったK-meansクラスタリング結果
[ 図を拡大 ]
図:主成分分析による2次元の主成分に沿ったK-meansクラスタリング結果
脚注
  1. ^ ロジスティック回帰:いくつかの要因(説明変数)から「2値の結果(目的変数)」が起こる確率を説明・予測することができる統計手法で、多変量解析の手法の1つである。
    プロビット回帰:ロジスティック回帰分析と同様、ある特性の反応確率を表す目的変数が説明変数の影響でどのように変化するかを分析する手法である。
  2. ^ Random Forest: バギング(ブートストラップ平均)と決定木を組み合わせたアンサンブル学習法である。
    XG-Boost:決定木の性能を向上させるために学習インスタンスの重みを繰り返し調整し、複雑な相関関係や非線形関係を持つ高次元データの処理にも優れているブースティング機械学習手法である。
    Lasso: ペナルティ項をもつ線形回帰モデルとなり、変数選択のための強力な手法である。
  3. ^ クロスバリデーション: データの解析と評価を交差させることで、より正確な推定値を求める手法である。
  4. ^ K-meanクラスタリング法: 主成分分析(PCA)の結果に基づき、クラスター内の分散が最小になるようにn個のクラスターを分ける手法である。