ビッグデータと公的統計調査:「作る・伝える・活かす」工夫

開催日 2020年1月22日
スピーカー 小西 葉子(RIETI上席研究員 / 大阪大学経済学研究科特任教授(常勤))
コメンテータ 迎 堅太郎(経済産業省大臣官房調査統計グループ政策企画委員)
モデレータ 井上 誠一郎(RIETI上席研究員)
ダウンロード/関連リンク
開催案内/講演概要

経済産業省では2016(平成28)年度以降、「ビッグデータ新指標開発プロジェクト」に取り組んでいる。消費者物価指数など公的統計の作成の一部に民間のビッグデータを活用する例は国内外にあるが、わが国において国の統計調査を民間ビッグデータのみで作成するのは本プロジェクトが初めてとなる。ビッグデータを統計に活用することで、将来的には公表の迅速化、調査項目や地域の細分化が可能となり、公的統計の利活用が促進されると考えられる。本セミナーでは、同プロジェクトが市場動向を誰でも観察・分析できるように作成・公開した「BigData-STATS(β版)」の成果を基に、公的統計の政策現場への活用の可能性やビッグデータを用いた統計作成上の課題について議論した。

議事録

ビッグデータプロジェクトについて

小西葉子写真経済産業省が2016(平成28)年度以降取り組んでいるビッグデータプロジェクトは、2019年度、「ビッグデータを活用した新指標開発事業(短期の販売・生産動向把握)」というタイトルの下、次の3つの目標を掲げて展開してきました。

目標1は、「平成30年度ビッグデータを活用した商業動態統計調査の実施・結果検証および新指標開発事業」を引き継ぎ、統計法に基づく基幹統計化を目指すことです(作る)。目標2は、ビッグデータを活用した新指標を作成し、ダッシュボードとして公表することです(伝える)。目標3は、大雨や台風などの自然災害、消費増税など経済活動や暮らしに影響を与える事象について、現状把握とその対処に役立つ指標開発と分析を行うことです(活かす)。

プロジェクトでは2018年から、ビッグデータを活用した「商業動態統計調査」の実施に取り組み、統計法に基づいて基幹統計調査として実施することをゴールに活動してきましたが、2020年の1月に総務大臣による承認を得て、実施可能となりました。

公的統計調査の現場では、報告者の負担軽減が重要視されます。従来の方法で報告者負担を軽減しようとすると、裾切りによって調査対象の規模を小さくする、調査項目を削減する、調査間隔を長くするなど、どうしても統計の規模が縮小方向に走ってしまいます。そこで、ビッグデータプロジェクトでは、その方法を一度忘れて、ビッグデータやテクノロジーを活かすことで、報告者負担を軽減しながら統計調査の質や精度を向上させることができないかを主眼において活動することにしました。

具体的には、調査票やオンライン収集でデータを集めるのではなく、民間企業がビジネスに活用するために収集しているデータや、報告者が日常の業務や行動の記録のようにいつの間にか出しているようなデータで公的統計調査を作成できないかということです。そして公的機関で作成した成果を分かりやすく、利用しやすくするためにデジタルダッシュボード化して公表し、利用者の利便性を高めることが主眼となります。

作る工夫:公的統計調査を民間ビッグデータで置き換えたい

われわれは2014年から、どういう会社のPOSデータであれば公的統計調査作成ができるかを調べ始めました。その中の1つがジーエフケーマーケティングサービスジャパン株式会社(以下GfK社)の家電市場のデータで、彼らの保有するPOSデータは市場カバー率が高く、全市場の販売額のシェアも高いことがわかりました。そこで、GfK社のPOSデータを使って商業動態統計調査の家電大型専門店についての「丁2調査」を実施することを目指しました。

まず、2018年7月、総務大臣の承認を得て、統計法に基づく一般統計調査として、POSデータを活用して商業動態統計調査を実施しました。GfK社が持っているデータを経済産業省の調査票の形や項目にそろえたものを国の統計とするという枠組みに許可をもらったわけです。つまり、調査票を送る必要も企業が記入する必要もがなくなり、国も報告企業も負担が軽減されます。

でも、これはまだゴールではありません。商業動態統計調査は基幹統計調査だからです。一般統計調査は、回答が任意の調査ですが、基幹統計調査は統計法の下で報告義務があります。もちろん精度や承認プロセスについても、もう一段厳しくなりますし、アップグレードが求められます。そこで、基幹統計調査として認められるために、データの精査を続け、実現可能性についても盤石になるよう努力を続けました。そうして2020年1月に2020年4月1日以降、POSなどのデータ受付を開始し、基幹統計調査として公表することを総務大臣から承認されました。この方法では、報告義務者が各家電量販店であることは変わらないのですが、今まで通りに報告者自身が調査票に記入することもできるし、希望すれば、GfK社が集信しているPOSデータを統計調査票の項目に合わせて組み換えたものを経産省に提出することになります。この枠組みが基幹統計調査として認められたことがとても大きな成果です。これにより。他省庁の統計調査にも応用可能になります。たとえば交通系カードのデータやPOSデータ、位置情報など、それらを使えば統計調査を再現・実施できることが分かった場合には、総務省の承認をもらって自分の統計にビッグデータを活かせるようになるということです。

伝える工夫:ダッシュボードを作成してユーザーを増やしたい

プロジェクトのもう一つの目的についてお話しします。私たちは、伝えること使ってもらうことの重要性を常に考えて活動しています。その中で、短期の販売・生産動向の把握に役立つように、「BigData-STATSダッシュボード(β版)」を2019年11月に開設しました。β版とつけている意図は、まだ開発途上であり、これからも改善されていくということを示しています。つまり、公的機関から公表するけれど、社会状況やユーザーのニーズに合わせてその様式や内容を柔軟に変更しますよという意味も込めています。

統計のダッシュボードとは、飛行機や車の計器のダッシュボードように、一目で重要な情報が得られるように、グラフと数字を一緒に視覚的に出して、かつグラフやデータを簡単にダウンロードできるもののことです。総務省の統計情報のサイト「e-Stat」にも、自治体、民間、教育現場などでどんどん使ってもらうために「統計ダッシュボード」を公表しています。

昨年度海外調査に行ったシンガポールのダッシュボードは、蛇口をひねると水が出ていくように、ユーザーの求めに応じて扱いやすい形で即時に統計データを出すことを目標にしています。これはとてもいい言葉だと思っていて、蛇口をひねったら水が出るのはインフラの基本であり、統計インフラやデータのインフラもそれと同等に整えようとシンガポールは考えているということです。つまり、データで戦略を立てて国際社会と戦っていこうと考えているのだと思います。

われわれのダッシュボードでは、「METI POS小売販売額指標[ミクロ]」を11月29日に公表しました。GfK社の家電のPOSデータと、インテージ社が保有するPOSデータを利用して指標を作成しています。指標の種類は2015年を基準年とする販売金額指数と前年同週比、前年同月比があり、2012年から足元まで毎週金曜日に公表しています。

業態はスーパーマーケット・コンビニ・ドラッグストア・ホームセンター・家電量販店です。地域は家電量販店が5地域、残りの販売店は9地域に分けています。政府の公開データでは、年次や月次が多く、全国集計が多いですが、ダッシュボードでは週次データで地域分析も可能です。ぜひ皆さんダウンロードして活用していただきたいと思います。次の活かす工夫では、活用事例を紹介します。

活かす工夫:身近な政策やイベントの影響をデータから観察したい

新しい指標やデータを公表したら、活用してくれるひとが多いととても励みになります。私たちがダッシュボードで毎週公表している新指標は、2019年12月に月例経済報告関係閣僚会議資料で取り上げられ、とても励みになりました。ドラッグストアと家電5品目の販売額が10月の消費税率引き上げ時に駆け込み需要や反動減があったかどうかを見るグラフに活用されました。

われわれが公表している「METI POS小売販売額指標[ミクロ]」の中の前年同週比を紹介していこうと思います。スーパーマーケット、コンビニエンスストア、ホームセンター、ドラッグストア、家電量販店の各販売チャネルで、2019年の10月1日の消費税率引き上げの影響を観察しますと、コンビニエンスストアだけは消費税率引き上げ前後で他チャネルと逆の動きをしていることが分かりました。これは2018年10月のたばこ税の税率引き上げの影響であると考えられます。

また、スーパーマーケットで、軽減税率対象の食品が税率引き上げ前に変化がなかったのに対し、化粧品などの軽減税率非対象品は2014年4月の前回の引き上げ時と同じように駆け込み需要が見られました。

今回の消費税率引き上げは、前回(2014年4月)と比較して、カラーテレビは駆け込み需要が大きくなりました。これは2009年の省エネ政策のエコポイント制度からちょうど10年がたち、買い替え時期と駆け込み需要が重なったためとみられます。パソコンは、前回は2014年4月、今回は2020年1月にWindows7のサポート終了があり、引上げ後でもサポート終了直前には販売が増えています。消費税率引き上げの影響をみるときには、このような定性的な情報も調べないと、正しく理解できなくなります。

トイレットペーパーの各チャネルでの販売額を見ると、ホームセンターやドラッグストアのようにたくさん安く買える販売チャネルでは前回よりも増えていますが、コンビニでは前回とほとんど差がありませんでした。

主食(米、パスタなどを含む)は、前回の消費税率引き上げ時は、ホームセンターなどで駆け込み需要が見られたのですが、今回は軽減税率の対象となり、あまり変化がありませんでした。しかし、増税後に全ての販売チャネルでやや増えています。何が起こったのでしょうか?

この点について、全国の数字ではなく地域別で細かく見てみましょう。コンビニエンスストアの食料品のグラフを例にします。関東で2019年の10月の消費税率引き上げから1週間後に食品の販売額が上がったのは、10月10日~13日に台風19号が本州に接近した影響によるものです。一方、台風19号は関東以北を通過したので、近畿では影響がみられませんでした。同様に、2014年2月にも一気に消費が増えた時期がありますが、これは東京に大雪が降った時期と重なります。このときも近畿では影響は見られません。

それぞれの前年同月比もグラフに載せています。月次に集計して指標を計算すると、平準化されてしまい台風や大雪の影響が見えにくくなるのがわかります。販売額が上がっていることはわかるのですが、緩やかなため台風や大雪といった気象変動が原因だとわかりにくくなります。そして、需要が緩やかに上がったことを見て、消費是率引き上げでは需要が冷え込まなかったという判断になってしまうかもしれません。そう考えると、年次データで分析し、政策を評価するときには、注意が必要ですし、可能ならばこのようにデータを細かく見て、いろいろな事象があったことを確かめないと、結果をミスリードする可能性があることが分かると思います。

ダッシュボードでは2019年12月27日に、野村證券とともに開発した新指標も講評しています。今日は1つ紹介しようと思います。まず、「METI×NOMURA POS-プレミアム志向インデックス(プチ贅沢指標)」私たちが飲み物を買うときに1ml当たりの値段で比較することは少ないと思います。そこで、容量単価(円/ml)をクオリティ指標と考えて、高い順に並び替え、売上高の上位25%の商品をプレミアム品、下位25%を買い得品として比率を作りました。1を超えたらみんながプレミアム品を買う傾向に走っていて、1を下回ったらお買い得品を買う傾向になっていることを示します。内閣府が発表している消費者センチメント(消費者態度指数)が上向いたときにはプレミアム品を買い、下向いたときには逆の行動を取るという結果が得られました。こういう新しく、面白い指標も公表しています。

まとめと今後の課題

公的統計は精度向上が求められる一方で、調査環境はますます悪化しています。なぜなら、まず私たちの環境が変化しているからです。シェアエコノミーなどの新ビジネス、製造業のサービス化、固定電話から携帯電話への移行、など人々の生活が変化しています。

統計作成現場にも変化があり、経産省統計グループの2019年の人数は2006比で24%も減っています。さらに、若手職員も不足しています。経団連は2016年に、家計や企業からの報告に情報源を依存した従来の統計調査方法だけでは公的統計の質を維持することが困難だと提言しています。

本プロジェクトでは、ビッグデータと技術の活用によって、報告者や作成現場の負担軽減を実現しつつ、質や価値が維持・向上する統計調査を行うための方法を探索し続けてきました。ただ、私たちが行ってきたことが、統計現場が抱えている課題を解決する唯一の方法ではなく、最初の一歩が始まったばかりだと思っています。

プロジェクトの推進・継続に必要なことは、予算、手続き、マンパワー、アイデア、熱意、教育などいろいろありますが、加えて時間的な猶予も必要です。2014年の調査開始時に最終着地点まで見通すのは困難でしたし、プロジェクト期間や人、組織の目標の継続性の担保はとても難しいです。分散型で各省庁が統計調査を実施している状況だからこそ、少し先の未来を見つめた新たな試みが重要であると考えます。

あとは、何といっても応援する人が必要です。新しいことを始めると、素直に「いいことをしているね」と言う方にはなかなか出会いません。ぜひ応援する人が欲しいです。ですから、是非皆さん、ダッシュボードを見て活用してください。それが私たちにとっての一番の励みになります。ビッグデータを使って公的統計調査を作るという大きな一歩を踏み出せました。POSデータで作った新指標をダッシュボードで公開することもできました。是非活用をよろしくお願いいたします。

コメンテータ:
公的統計には、「品質向上と負担軽減」のほかに、「正確性と速報性」「継続性と革新性」のそれぞれどちらを取るのかというジレンマがあり、それらのいくつかをビッグデータを使って解消することがプロジェクトの目的です。

今後の課題としては、ビッグデータにも現行の統計調査にもそれぞれ得意不得意があり、これらを組み合わせることが必要になるということです。

もう1つは、公的統計には慣性の法則が成り立ちやすいということです。統計調査は放っておくと継続しようとする力が働いてしまうので、作る側も評価する側も、今やっていることとこれからやる可能性のある取り組みを平等に評価する必要があると思っています。

そうしたことを念頭に置いた上で、どこにニーズがあるのか、ユーザーは何を利用しているのかを考えなければなりません。それから、統計調査からビッグデータに変わっていく中で、人材や能力、調査の担い手も変わっていきますので、そういった確保もしなければなりません。

もう少し視野を広げると、公的統計のステークホルダーも変化します。大昔の公的統計は政府が作って、政府が使うものでしたが、ビッグデータの時代は民間が非常に重要な役割を果たすようになり、民間統計と公的統計が競い合い、助け合いながらデータを出していくことが望ましいとされています。

2020年は統計の世界にとって、証拠に基づく政策立案(EBPM)の先駆者であるナイチンゲールの生誕200周年、日本の国勢調査第1回から100年という節目の年です。その年にビッグデータの活用について進捗があったと後から振り返られるようにこれからも精進していきたいと思います。

質疑応答

Q:

クレジットカードデータの方が個人の属性と照らし合わせて正確な分析ができるメリットがあるように思います。

A:

通常のPOSデータですと、個人の属性が結び付いていません。一方、クレジットカードは所得情報など非常に細かい情報も取ることができます。ただ、使用したときの購買行動しか見えず、また複数枚持っていて全く稼働していないカードもあったりします。そういう点で、消費者市場を包括的に分析するには、現状ではPOSデータの方が便利だと思います。

Q:

報告者の環境の変化として製造業のサービス化、サービス業のものづくり化が進んでいます。その点で統計の精度を上げたり、何か検討されていることはありますか。

A:

製造業のサービス化、サービス業の製造化が進展する中で、どのように統計を作っていくかという問題は、経済学や貿易の分野では関心が高いところです。統計行政では、標準産業分類を定期的に改善もしています。しかし、なかなか現実を反映した業種分類を短い間隔で策定し、反映していくことは困難な状況です。

経済産業省の調査統計グループの取り組みとしては、私の知っている範囲ではシェアエコノミーの実態を調査したり、統計を取ったりできないかというプロジェクトも迎さんを中心に行われているので、新しい業種をどう捉えるかという意味でとても価値があると思います。

コメンテータ:

1つは、統計分類を改めていくことが必要であり、現在、総務省を中心に産業分類や生産物分類の改訂をしています。もう1つは、サービス化するとどこで事業をしているのかが分からなくなってくるので、それは行政記録情報を使って補完することがあり得ると思います。

Q:

デジタル化の統計はどのようになっていますか。

コメンテータ:

国際的には経済協力開発機構(OECD)や国連でデジタル経済の把握に関する研究が進められていて、そういった議論に日本も参加していくことが求められます。デジタル課税についてもOECDが研究していますが、統計も同じような取り組みがされています。

Q:

データを週次で取っている点が新しいと思いますが、取ろうと思えば実際には日次でも取れるのだと思います。期間を短くすればするほど速報性は出ますが、読み取りづらくなって、ものすごく振れのある統計になってしまいます。その辺の見やすさや解釈の紛れが出ないように発信していく必要があると思います。

A:

今日、皆さんに週次データを見ていただいただけでも、グラフが結構ジグザクしているのを見て頂けたと思います。私たちはPOSデータを使用しているので、実は時間単位でもグラフを描くことができます。データは、細かいほどとてもありがたいのですが、それとともに細かい個別のショックが含まれ、データの振れ幅が大きくなり、平均的な傾向を見るのが難しくなります。

一方で、データ分析をしていると、年単位、月単位と集計データを使うときの安心感はとても大きいです。個別のショックが平滑化されるからです。しかし、集計し過ぎると、今度は、先ほどの例のように、台風やイベントの効果が見えにくくなります。

ですから現時点では、ご指摘の通り、日次データは細かすぎると判断しています。速報性と分析しやすさから、週次で公表しています。通常、無料で公開されているデータの多くは年単位なので、年次データではどれ位情報を見落としているかも気づいていただけるといいなと思っています。

Q:

事業者が協力するという点では、マクロだからデータを出せているのだと思います。しかし、細かくなればなるほどビジネスとしての価値を持ってしまうので、無料で提供できるかという話になると思います。共生できるという言葉はきれいですが、マクロの段階が一通り終わったら、その先に進めない段階が来てもおかしくないと思います。その点では、事業者とお話しされて本当に共生できると思われましたか。

A:

POSデータを集計し、マクロ指標を作っているから耐えられているというのは本当にごもっともで、今後、より詳細なデータを基にした指標を作っていくと、協力企業にとって不利になるようなことが起こり得ると思っています。例えば、POSデータ情報が様々な企業から得られてほとんど加工しない状態で公表したとします。その販売動向を見ていたインターネットショップの企業が、実店舗営業の企業行動を織り込んだ戦略を打って、より利益を上げようとするかもしれません。ですから、協力を仰ぐと同時に、協力企業が不利な立場にならないようにする道筋を同時に考えていかなければならないと思っています。

この議事録はRIETI編集部の責任でまとめたものです。