RIETI政策シンポジウム

大規模業務データから何を学ぶか-経済学と物理学の統合アプローチ (議事概要)

イベント概要

  • 日時:2009年3月5日(木) 14:00-18:30
  • 会場:如水会館 スターホール (東京都千代田区一ッ橋2-1-1)
  • 議事概要

    開会挨拶

    藤田 昌久 (RIETI所長・CRO)

    情報技術の急速な発達は私たちの生活を大きく変化させてきている。これは我々研究者の研究方法、研究スタイルにどのような影響を及ぼすか。これが本日のテーマである。

    ビジネスの現場に目を向けると、Eメールやインターネットの普及,これらがビジネスのやり方を大きく変えている。それ以外でも、POSデータや電子マネー、オンライントレーディングなどのビジネスのさまざまな現場で、情報通信技術が重要な役割を担うようになってきている。

    研究者の観点から注目すべきは、ここで蓄積される電子情報である。たとえば、POSデータには、あるコンピュータで何時何分何秒にどのような人が来店し、何をいくらで何個購入したかが、すべて電子的に記録されている。一昔前まではこうした情報は紙の上に記録されており、研究者が見ることは物理的にもほとんど不可能であったが、情報通信技術の発展により研究者も利用できるようになった。研究者が利用できる業務データの拡大により、研究の可能性が画期的に広がりつつある。

    RIETIの活動を例に挙げると、オンライン市場での価格形成、為替相場の分析、企業間取引ネットワークの研究など、さまざまなプロジェクトにおいて、多くの企業からのご支援・ご協力により貴重な業務データを提供していただき、先駆的な研究を進めている。

    こうした業務データの魅力に着目しているのは、経済学や経営学の研究者だけではない。自然科学の研究者、特に物理学の研究者も、こうしたデータを活用して経済現象の解明を試みている。本日のテーマのサブタイトルに、「経済学と物理学の統合アプローチ」とあるのはその意味である。経済学と物理学は歴史的にも非常に深い関係にある学問領域であり、業務データの活用を手がかりとして、2つの学問領域がさらに密接な関係を築く可能性がある。

    本日は、物理学の分野で経済現象の研究に先駆的な役割を果たしてこられたスタンレー教授をはじめ、この分野を切り開いている研究者の方々をお招きしている。業務データの活用により、経済現象のどのような側面が解明されてきているのか。今後、業務データの活用をさらに促進するにはどのような施策が必要か。さらには現在進行している金融・経済危機の解明と解決に、業務データはどのような役割を果たせるのか。こうした点について、実りのある議論がなされることを期待している。

    このシンポジウムのねらい

    渡辺 努 (RIETIファカルティフェロー)

    経済学者が利用するデータがどのように変化してきたのかを、私個人を例にとって説明したい。私が経済学の研究を始めた30年ほど前に使っていたデータというのは、SNA(国民経済計算)やCPI(消費者物価指数)や鉱工業生産などだった。これらは、多くの企業や家計の行動を集計したもので、統計の作成者は政府である。

    では、現時点において、RIETIなどでの研究活動で使っているデータを挙げてみよう。たとえば、EBSという為替の取引データは、為替の取引一本一本について価格と取引量を表示したもので、kakaku.comでは、デジタル家電についてさまざまな商品の価格や量が取引レベルでわかる。また、リクルート社が出している住宅雑誌に掲載の賃貸物件の取引を収録したデータもある。さらには、日経やIntageやBCNといった企業の協力を得て、スーパーや家電量販店での商品ごとの売上を収録したスキャナーデータを用いたり、帝国データバンクや東京商工リサーチの協力により、企業と企業の間の取引関係のデータも用いたりしている。

    これらのデータの共通点は、SNAなどと違って集計していない、つまり、取引一本一本に近いという点である。また、これらのデータは政府ではなく企業が作成したものであり、その点でも昔のデータと異なっている。これらのデータは各企業がビジネスを円滑に進めるために生成するものであり、その意味で「業務データ」である。したがって、我々研究者による研究目的の利用は当初の意図ではなく、「流用」である。

    企業がつくったデータを流用するということは、企業の協力なしでは、こうした研究が成り立たないということを意味する。しかし逆にいえば、企業の協力を得られれば、もっと多様なデータを研究者が手にすることができ、それによってさまざまな経済現象の理解を深めることができる。本日のシンポジウムでは、幅広い業務データの活用を促進するための方策について議論していきたい。

    基調講演1「ネットワーク科学の最先端:インターネットの繋がりからビジネスネットワークなどへの展開」

    Albert-László BARABÁSI (ノースイースタン大学)

    社会現象の背後に潜むネットワーク構造

    代表的なネットワークの事例として、インターネットや企業内での個人の繋がりを挙げることができる。前者は通信回線で物理的にコンピュータ同士が繋がり、後者はE-mailなどのコミュニケーションによって人と人とが繋がりを持っている。一般的に社会現象のネットワークは、ランダムにコンピュータや人同士が繋がっているわけではなく、少数の特定のコンピュータや人に接続が集中する。このような性質を持つネットワークはスケールフリーネットワークと呼ばれる。

    ネットワークは、ノード(コンピュータや人など)が、次々とお互いに繋がることによって形成される。それぞれのノードが、優先的選択と呼ばれるコネクションの数の多いノードに繋がりやすい性質がある場合、スケールフリーネットワークが生まれる。スケールフリーネットワークは、それぞれのノードが故障する確率が等しい場合、多くのノードが故障してもネットワークの構造が維持されるため、故障に強い。しかし、外部からコネクション数の多いノードへの集中的な攻撃には脆弱で、それらのノードが故障するとネットワークは崩壊する。

    ネットワーク分析の応用例

    各国が輸出する製品の組み合わせを調査すると、「バナナ」を輸出している国はしばしば「マンゴー」も輸出しており、「自動車」を輸出している国は「電子機器」も輸出している。これはマンゴーを生産・出荷する技術はバナナと似ているからであろう。同じことは自動車と電子機器にもいえる。つまり、生産・出荷の技術という観点から商品をグルーピングできるということであり、その意味で商品間のネットワークと見ることができる。商品間のネットワークを各国について調べることにより、どの国はどの商品の生産・出荷に強みがあるのかといった輸出戦略を探ることが可能になる。

    基調講演2「インターネットデータを用いた社会ネットワークの解析:YouTube、オープンソースソフトウェア、サイバーリスク、金融市場」

    Didier SORNETTE (スイス連邦工科大学)

    Googleでの検索ワードの入力件数やYou Tubeの閲覧数

    最近、Googleにおけるインフルエンザに関連する単語の検索件数の時間変動から、将来のインフルエンザによる入院患者数を予測できることが報告された。ニュースなどのイベントが発生したショックによって、検索語の件数や閲覧数がどのように応答、つまり、変動するかを調べることにより、件数や閲覧数の時間変動のメカニズムを明らかにすることが可能である。Googleにおける「tsunami」の検索件数は2004年12月の災害以降に瞬間的に増加し、急速に減衰した。これは外的なショックによる典型的な応答である。一方、「harry potter movie」の検索件数は映画公開日に向かって緩やかに増加し、その後は緩やかに減衰した。これは内的なショックによる典型的な応答である。

    ショックによる応答現象

    このような応答現象は、人がニュースなどの情報を入手してから、検索や閲覧するまでにかかる時間が存在し、また、これらの情報がコミュニケーションにより他人に伝搬する環境が存在する場合におきる。検索数や閲覧数のピークからの減衰の速度から、コミュニケーションが、どれほど密であるかを知ることができる。このようなショックによる応答を分析する手法は、金融市場におけるボラティリティの変動や、ネットにおけるサイバーアタックの発生件数の変動にも応用が可能である。

    Q&A

    基調講演1、2に対してフロアから以下の質問があった。

    Q1

    論文の引用件数の増加は指数的であるのか?

    BARABÁSI氏

    ネットワーク効果による内的や外的な事象は、論文の引用件数の増加とは異なるべき関数に従い増えていく。

    Q2

    論文の引用件数の増加は内的、外的のどちらの事象か?

    SORNETTE氏

    ネットワーク効果による内的や外的な事象は、論文の引用件数の増加とは異なるべき関数に従い増えていく。

    Q3

    現在の金融危機はネットワークの視点からどのように理解できるのか?

    BARABÁSI氏

    銀行間の相互信頼が失われたために、銀行間や企業間の資金の流れのネットワークが分断され、企業が必要とする資金を調達できない状況になっている。

    Q4

    リーマンの破綻によるショックは内的、外的のどちらの事象か?

    SORNETTE氏

    ショック影響が長時間持続していることから、内的な効果が強いと考えられる。

    Q5

    うわさで景気が悪くなるという状況を上向きに修正する方法はなにか?

    BARABÁSI氏

    うわさを定量化することは難しい。定量化したデータを入手しなければネットワーク分析ができず、修正方法を提示することはできない。

    SORNETTE氏

    群衆現象により起きる悪いうわさのフィードバック効果を断ち切るには、中央銀行は極めて明確に抜本的な政策転換をしなければならない。

    基調講演3「マーケティングにみられる人間の行動」

    高安 美佐子 (東京工業大学)

    販売間隔のランダム仮説の検証

    個々の人間の行動には、それぞれに理由や目的が存在し、個々のレベルではランダムではないものの、多くの人間を観察すると全体ではランダムな振る舞いをする。コンビニエンス・ストアのPOSデータを用いて、このランダム仮説を検証した結果、秒単位の販売の発生間隔はポアソン過程で近似されること、1時間程度の時間スケールではポアソン過程のパラメーターが徐々に変化していることが示された。これは、コンビニエンス・ストアにおける人間の購買行動が集団としてはランダムとみなせることを意味している。

    バーゲンセールの特性

    次に、スーパーマーケットのPOSデータを用いて、人間の群集心理を分析すると、当日と前日の価格比と販売量比の間には非線形なべき乗の関係が存在すること、そのべき指数は商品の賞味期限に依存することが示された。これは、スーパーマーケットにおいて人間の購買行動がバーゲンセールに対して過敏に非線形に反応すること、賞味期限が長い商品ほど、買いだめがきくため、バーゲンセールに対する購買行動の反応が大きくなることを意味している。

    金融市場での売りと買い

    金融市場は、秒単位で価格が変化し、参加主体は売り手にも買い手にもなれるという特徴を持つ。為替市場のデータを用いて特性を分析すると、為替市場の挙動はランダムウォークの概念だけでは記述することができず、物理学のポテンシャルという力の概念を導入するとうまく記述できる。この概念を用いて分析を行うと、為替市場の統計性は内的なゆらぎや外的なニュースなどの影響で変化すること、ディーラーのトレンドフォローの効果によって頻繁に価格の大変動が発生すること、トレンドフォローの効果は市場のポテンシャルで記述できることが示された。

    インターネットの口コミ

    インターネットにおけるブログ内で用いられるキーワードの数を使って、インターネットの口コミ情報について分析を行うと、季節性や一時性など時限性のあるキーワードについては、キーワードの使用件数とイベント時点からの時間間隔の間にべき乗の関係があること、発生頻度が低いキーワードはランダムで発生するが、発生頻度が高いキーワードはランダムではなく相互作用を持つ時系列の振る舞いをすることが示された。

    Q&A

    基調講演3に対しフロアから以下の質問があった。

    Q1

    外国為替市場のポテンシャルを解析する方法には、どのような狙い、目標があるのか?

    高安氏

    最もニーズがあるのは、リアルタイムもしくは未来にどの程度のリスクがあるのかを定量的に測定することにある。また、ポテンシャル理論で興味深いのは、理論的に市場価格の変動の時間を無限大にするような繰り込み計算を行うと、その解はランダムウォークする解、指数的に発散する解、有限時間で発散する解の3つのパターンしかもたない。

    Q2

    うわさがどのように伝播して社会を動かすのか。現在の景気の悪化も、景気が悪くなるといううわさが実際に経済を悪くしているのではないか?

    高安氏

    うわさと販売量の間には明確な相関が存在する。現在、うわさとの相関が強い商品と弱い商品の事例を調べている。うわさと販売量の相関については、どちらからどちらへの因果関係が働いているのかを識別するのが難しく、それを解明するには時間がかかる。

    パネルディスカッション:「大規模業務データの活用策」

    セッションの概要

    本パネルディスカッションでは、以下の問題意識のもと、議論が行われた。

    1. 大規模業務データの研究利用をさらに促進するためにはどうすればよいか。
    2. GDP統計などの政府統計と業務データの関係をどう考えていけばよいか。

    司会:渡辺ファカルティフェロー

    業務データをどのように収集しているか。データを収集、利用する上で、技術的、法的に困難な点は何か。業務データの活用が、この困難な点を克服しながら、今後どのように進んでいくのか。

    SORNETTE氏

    業務データを利用するうえで最も困難な点は、技術的な問題ではなく、法的な問題である。たとえば、AmazonやGoogleが保有しているようなインターネット上で最も価値ある情報は、非常に秘匿性が高く、解放されていない。このような傾向は今後も変わらないと考えられ、我々はこれらの問題に対して1対1、ケースバイケースで対応していかなければならない。

    H. Eugene STANLEY (ボストン大学)

    この問題に対する一般的な答えはない。たとえば、携帯電話会社のデータを使って分析を行おうとするならば、そこには法律的、倫理的な問題が必ず生じる。しかしながら、そういった秘匿性が高い特殊なデータを使わなければ何もできないということではない。

    たとえば、Yahooがウェブ上で公開しているようなS&P500の終値のデータを見るだけでも標準的なトレーダーモデルを検証することができる。また、全ての取引を記録したような膨大なデータについてもそれほど高価なわけではなく、今では多くの研究者が利用している。そのような膨大なデータは貯蔵するのにいくつかの困難が伴うものの、それ以外の点においてはそれほど問題ない。こういったデータを入手しさえすれば、新たな発見をすることができる。我々は、これらのデータから、金融の津波は稀にしか発生しないものの、そのようなことが発生する確率が確かに存在することを発見している。

    司会:渡辺ファカルティフェロー

    金融の津波が非常に珍しい現象であることと、数千・数億の膨大なデータが必要であるということはどのように関係しているのか。

    STANLEY氏

    データが膨大であればあるほど発見を行える確率が高まるが、データがそれ程大きくなくても発見は行えるかもしれない。ただ、データが膨大でない場合には説得性に欠けるかもしれない。

    SORNETTE氏

    データが膨大であればあるほど悪いこともある。情報が多すぎるとノイズもまた大きくなる。そこから合理的な情報を取り出すのに膨大な時間とコストがかかることもある。つまり、大量すぎるデータは新たな問題を生み出すこともある。

    司会:渡辺ファカルティフェロー

    業務データを電子的に収集するというアイデアについて詳しくお聞きしたい。

    出口 弘 (東京工業大学)

    1. 現在の国の基幹統計は、民間のデータが電子的な業務データの形で存在しているにも関わらず、改めて紙の調査票へ記載するという形をとっており、これは非常に大きなコストとなっている。
    2. これら民間の業務データについて、電子的なフィルタリングをかけることで状況が変わってくる。そのためには、民間の電子データや企業のデータの秘匿情報を守った上で、ある種の公共財として集計データを活用して、それが民間へきちんとフィードバックされることが課題となる。
    3. そのためにはある種の抽出フィルターを設計する必要があるが、先行事例として日本銀行による銀行データのXBRLによる抽出、金融庁による各財務諸表のXBRLによる公開、厚生労働省のJANISなどが挙げられる。
    4. このような電子抽出の可能な領域として、病院のカルテや検査のオーダーリングシステム、レセプトシステム、企業のERP、POSデータの活用などがある。また、PASMOあるいはSUICAを利用したパーソントリック調査なども考えられる。

    司会:渡辺ファカルティフェロー

    そういった電子抽出をやるうえで、現実に問題やハードルとなる点は何か。

    出口氏

    技術的なハードルよりも、民間に協力を求めるための制度的なハードルが大きい。特に、これは公共財なのか共有財なのか、また、データがどういう形でフィードバックされるのかに関する明確な観念が出来ていない。こういったデータを利用して、どのような推計ができ、どのようなメリットがあるのかというビジョンを明確にすることが重要。

    司会:渡辺ファカルティフェロー

    業務上生成される金融関係のデータがどのように生成されているか。それを外部に出す可能性はどの程度か。

    松本 大 (マネックスグループ株式会社)

    1. 当社のマネックス証券はオンライン証券なので、注文、約定、取引のデータが全て存在しており、簡単に利用できる環境にある。しかしながら、そういった情報は利用する主体によって活用できる幅が異なることから不公平さが生じる可能性もあるため、当社ではこのデータは一切外部公開していない。
    2. 外部公開はしていないが、社内では売買データの分析を行っており、短期売買と長期売買のパフォーマンスの比較や、お客様全体の売買の動向などについて分析をしている。しかしながら、そういった分析を行うには当社にトレーディングデスクがなく自己取引をしないことが条件であると考える。
    3. データの分析により、お客様へさまざまなフィードバックをすることができると考えられる。よりよいトレーディングツールの提供や、よりよいアドバイスの提供など。しかし、こういったことをフィードバックする上でも、当社にトレーディングデスクがないこと、更にお客様にデータを利用することについて許諾を得ることが必要だと考えている。
    4. 売買データは、1人1人の投資家のプロパティであることから、どうやって1人1人の投資家の利益を守れるか、もともと誰のためのデータ分析なのかということを考慮していかなければならない。

    司会:渡辺ファカルティフェロー

    日本銀行や政府は、企業間のキャッシュフローのネットワーク、銀行間のネットワークに関するデータをもっており、利用することも可能。こういったものを広く研究者が利用できる環境というのは整えられないか。

    岩田 一政 (内閣府経済社会総合研究所)

    1. 2006年から統計改革をやっており、個票データについて1カ所の統計のデータバンクを作り、さまざまな官公庁が行っているサーベイやセンサスを利用者が利用しやすいように加工するという議論が進んでおり、プライバシーを維持しながら、研究者にとっても利用しやすい環境が整えられるのではないかと考えている。
    2. 現在、内閣府社会研究所にて、AADLを用いた国民経済計算の推計作業を行っている。この作業の延長線上として、企業の取引ベースのデータを使い、国民経済計算体系を財務会計の手続きに従って構築することが理論的に考えられる。
    3. 金融のデータについては、東京証券取引所や日本銀行、金融庁でXBRLを用いた情報開示伝達システムを用いている。また、銀行間取引の決済データについては、日銀ネットのRTGS化というのを行い、即時にグロス決済するような仕組みがある。
    4. また、消費者物価指数についても、POSデータを部分的に使っている。

    司会:渡辺ファカルティフェロー

    今後、政府統計と業務データはどのように関係していくのか。

    岩田氏

    消費者物価指数については、現在すでに部分的にPOSという業務データを用いて改善を試みている。将来的には、より広範な範囲で業務データが用いられると考える。国民所得計算についても、業務データを用いて精度を高めることが可能。今後も業務データの役割は高まるだろう。

    出口氏

    今後、政府統計における業務データの役割は高まっていくと考えられるが、具体的な課題も多い。実際にどのようにデータの提供を受けるのか、欠損値や統計学的な歪みといった問題も存在する。また、民間データを用いた指標を作る際には、政府がしっかりと公益性や公共性を判断し、電子データの利用方法を設計する必要がある。

    質疑応答

    フロアから以下の質問があった。

    Q1

    経済学では、人間や企業といった主体同士のインタラクションを前提にしている。ある意味で、人々が景気が悪くなると思えば景気が悪くなるし、良くなると思えば良くなるという側面がある。その点について、物理学者はどのような見解をもつか?

    STANLEY氏

    個々の主体は自由意思に従って行動しているが、総体としては一定の法則に従っている。憶測ではあるが、多くの主体がある制限された一定のルールに従って行動する場合には、総体として一定の法則が表れるのかもしれない。それがなぜ生じるかを解明することが我々の興味であり、膨大なデータ利用が可能になった現在、その解明は可能であると考える。

    SORNETTE氏

    これは、内生的要因と外生的要因の衝突の良い例である。集団的に何かを信じることによって、それが内生的に生起することはあるが、それだけではない。我々は閉じられたシステムの中にいるわけではなく、さまざまなショックにさらされている。我々は社会を単なるいくつかのスピンによるシステムとしてではなく、階層的な方法で捉える必要がある。その点で、物理学者が経済学者や社会学者から学ぶことは多く、我々はこの新たな機会とデータベースを用いて、新たな方法を提示していく必要がある。

    Q2

    正規分布を前提としないオプション価格モデルは、将来的に開発可能か?

    STANLEY氏

    それは非常に大変なことである。しかし、事実を知っていれば、モデルの中で事実に反するものを取り除いていけば良いのであって、事実をトレーディングモデルに組み込んでいければ素晴らしい。

    SORNETTE氏

    多くのグループが、ファットテイルを組み込んだモデルを開発しており、企業もまた多くの改良モデルを開発している。既に多くの事実がモデルに組み込まれており、一定の成功を収めている。

    Q3

    この経済危機はいつ終わるのか?

    出口氏

    今回の経済危機はクレジットデリバティブがオフバランス化されることによって、サブプライムのようなものがどんどん生成されていくようなポジティブフィードバックが働いてきた。このプロセスに関する動的なシステムを理論的に理解し、制御することが重要。また、負債という仮想通貨が巨大なインフレーションを起こしており、これがクラッシュするのは当然である。これを制御できるようなシステムを構築することが課題。

    岩田氏

    今後の政策対応にかかっている。しかし、政策対応は政府が勝手に決められるわけではなく、金融機関が将来発生するロスについて、マーケット参加者と政府の見解がどこかで折り合う必要があり、また、納税者があり得べきロスを覚悟しなければならない。その三者の期待がいつ収束するのかに依存している。

    松本氏

    需要が戻ってくる最大の要因は気持ちの面が大きいのではないか。気持ちの要因の1つは、アメリカ政府による金融危機のバランスシート問題の見積もりについて、マーケットには疑問がある点。もう1つは、過去の日本において行われた処理策が全て尽くされないうちは、次の政策対応に対するマーケットの期待が残る点。逆にそれらが全部対応されれば、気持ちの面は戻ってきて、経済危機も終わるのではないか。

    SORNETTE氏

    この危機が予見できたのか、我々がより良いデータとモデルをもっていればこの危機を制御できたのかという問題について、忘れてはならないことは、皆がダンスを踊っているときに、ダンスホールを閉めるわけにはいかないということだ。これは人間社会に特有のものであり、我々はこの問題を単にモデルやデータ収集の問題に帰結させるべきではない。

    何が起きているかという点についていえば、金融が実体経済からかけ離れて拡大しすぎたことを我々は知っている。危機は危機ではなく、これは金融が実体経済に比して妥当な水準へと戻っていく過程である。

    問題なのは、過剰な悲観や信用の収縮であり、銀行は全てを凍結し、貨幣乗数は1を下回っている。ここで、我々物理学者にできることは、あるセクターが凍結した場合にそれをバイパスできるような強靭な経済システムの構造を提案することである。たとえば、WIR銀行システムのような平行ネットワークの構築は、その一例である。

    STANLEY氏

    危機がいつ終わるかは誰にも予測できない。我々にできることは、一生懸命に考え、議論し、リーダーたちに提言することだけである。何らかの行動がとられるべきであると考えるが、どの行動がとられるべきかはわからない。さまざまな学術分野の協力が必要。

    閉会挨拶

    及川 耕造 (RIETI理事長)

    本日のテーマの大きさあるいは深さに比べ、4時間半という時間があっという間に過ぎた感がある。大変エキサイティングであり、またプロボカティブな議論であった。プレゼンテーターの皆様、そしてパネリストの皆様に心から感謝したい。

    RIETIにおいては実証的な研究を進めているが、本日の議論を通じ、豊富で質のよいデータというものが研究の成否を、ひいては今後の日本あるいは世界をも決定していくということを改めて痛感させられた。

    このシンポジウムは、3月1日から開催されてきた国際会議であるAPFA7のいわば締めくくりとして、東京工業大学並びに一橋大学の協賛を得て開催することができた。両大学の関係者、特にこのシンポジウムのコーディネーションを務めていただいた一橋大学の渡辺先生に厚く御礼を申し上げたい。