ノンテクニカルサマリー

滞在人口データを用いた取引先企業のリース需要予測

執筆者 加藤 塁(三井住友ファイナンス&リース株式会社)/宮川 大介(早稲田大学)/柳岡 優希(株式会社東京商工リサーチ)/雪本 真治(三井住友ファイナンス&リース株式会社)
研究プロジェクト 企業ダイナミクスと産業・マクロ経済
ダウンロード/関連リンク

このノンテクニカルサマリーは、分析結果を踏まえつつ、政策的含意を中心に大胆に記述したもので、DP・PDPの一部分ではありません。分析内容の詳細はDP・PDP本文をお読みください。また、ここに述べられている見解は執筆者個人の責任で発表するものであり、所属する組織および(独)経済産業研究所としての見解を示すものではありません。

産業・企業生産性向上プログラム(第五期:2020〜2023年度)
「企業ダイナミクスと産業・マクロ経済」プロジェクト

コロナ禍を契機として、GPS位置情報データを用いて計測した滞在人口データの利用が近年急速に拡大している。工場の滞在人口データを活用したこれまでの事例として、高頻度の滞在人口データを用いて鉱工業生産指数を予測する試みや、同様に自動車メーカーの生産量を予測する試みなどが挙げられる。本研究では、こうした高頻度・高粒度のデータを活用する新しい取り組みとして、滞在人口データと企業間の取引関係を記録したサプライチェーンネットワークデータを併せて用いる(データフージョン)ことで、工場の滞在人口を計測した企業の「取引先」企業について、その企業活動を予測するモデルを構築した。

本研究では、第一に、個人のスマートフォン端末から収集したGPS位置情報データを基に、計測対象とした製造業に属する企業の工場の敷地内に滞在したことが確認された件数を日単位で集計したものを滞在人口データとして利用した。第二に、サプライチェーンネットワークデータとして、日本最大級の信用調査会社である株式会社東京商工リサーチ(TSR)が保有する、企業ペアレベルの取引関係データ(相関ファイル)を利用し、取引先の特定を行った。第三に、企業活動の代理変数として、国内最大規模のリース会社である三井住友ファイナンス&リース株式会社のリース契約データを利用した。

我々の最大の関心は、滞在人口データとサプライチェーンネットワークデータを用いることで、リース需要を代理変数として計測した取引先企業の企業活動をより高い精度で予測できるか否かにある。そこで、特定の期間に取引先企業がリース契約を行ったか否かを予測するモデルを、滞在人口データ及びサプライチェーンネットワークデータを利用するパターンと利用しないパターンについて構築し、モデル間での予測精度の差を比較した。モデル作成用のトレーニングデータと検証用のテストデータの構築に当たっては、下図の複数の条件に基づいてデータの期間を設定した。

図 モデル作成・検証用データの利用期間
図 モデル作成・検証用データの利用期間

下表は、上記の各データ期間に対応した予測モデルの予測精度をAUCという指標を参照して比較した結果をまとめたものである。ここで、AUCとは標準的には0.5から1の間を取る数値であり、数値が大きいほど予測精度が高いことを意味している。第一に、期間1と期間2の条件では滞在人口データとサプライチェーンネットワークデータを利用したモデルのAUCが、利用しなかったモデルのAUCより大きいことが分かる。つまり、滞在人口データとサプライチェーンネットワークデータが計測対象の企業の取引先企業のリース需要の予測に貢献していることを示唆している。第二に、期間3と期間4については、滞在人口データとサプライチェーンネットワークデータを利用しなかったモデルのAUCのほうが大きく、追加したデータが予測精度の改善に貢献していない。ここで注意すべきは、期間3と期間4のトレーニングデータが新型コロナウイルスにより初回の緊急事態宣言が発せられた期間を含んでいる点である。こうした観察事実は、企業活動が大きな外生ショックの影響を受けた期間を含むモデル構築の困難さを示唆している。なお、期間1のトレーニングデータについては、前述の通り企業活動が影響を受けた期間を含んでいるにも関わらず、滞在人口データとサプライチェーンネットワークデータを利用したことで予測精度が改善している。この背景には、期間1のトレーニングデータ期間が長いことが影響していると考えられる。すなわち、大規模な外生ショックの影響を含むデータの利用というコストとデータサイズの大きさというベネフィットのトレードオフの中で、データサイズのベネフィットが優位に働いたためと考えられる。

表 期間ごとの滞在人口データの利用有無別の精度比較
表 期間ごとの滞在人口データの利用有無別の精度比較

本研究の結果から、新型コロナウイルス感染症の拡大により企業活動が大きく攪乱された時期を除けば、滞在人口データとサプライチェーンネットワークデータの利用が取引先企業のリース需要予測に貢献することが確認された。また、相対的に長期間のデータを用いてモデルを作成することで、滞在人口データの貢献がより大きくなるという標準的な想定も確認された。近年急速に利用が拡大している滞在人口データについては、今後も引き続き蓄積されていくものと想像されるが、別種のデータとの併用と適切なデータの取り扱いを意識することで、当該データからより高い価値が実現されるものと考えられる。