産総研オープンラボ 講演会プログラム

ビッグデータ活用による未来社会
第一部 -AIST、IPA、RIETI連携企画- (議事概要)

イベント概要

  • 日時:2012年10月26日(金)10:30-12:00
  • 会場:産総研つくばセンター 第2会場(ネットワーク会議室)(茨城県つくば市東1-1-1)

経済活動や日常生活を通じて日々生成されるデータは、従来のデータベース技術や情報処理技術では取り扱いが難しいほど、巨大なデータ群となりつつある。こうした「ビックデータ」を有効に活用し、新たな産業の創出やイノベーションに活用する取り組みが世界的に注目を集めている。このような状況を踏まえ、RIETI、産業総合研究所(AIST)および情報処理振興機構(IPA)の3法人が連携し、産総研オープンラボの講演会プログラム(http://www.aist-openlab.jp/program)において、講演会「ビックデータ活用による未来社会」を開催した。講演会では、ビッグデータに関する社会や研究の動向と公的研究機関への期待、特に政府が収集し公開をしている「オープンデータ」の活用拡大に向けた制度設計上の課題や人材育成について、活発な意見交換が行われた。

議事録

基調講演

元橋 一之 (RIETIファカルティフェロー/東京大学 教授)

1. ビッグデータ時代のビジネスチャンス

ビッグデータという言葉が社会に知られるようになったのはここ数年のことだが、それ以前から、GoogleのページランキングやAmazonの「おすすめ」表示など、先端的企業では技術的取り組みが行われてきた。これまでのインターネットの世界は、人々がネットにアクセスし、そこからさまざまな情報を引き出すというものだったが、ビッグデータの世界では、センサーデバイスや事象から得た膨大なデータをウェブ上のデータと組み合わせ、ビジネスアプリケーションを提供している。

その特徴は、量、多様性、新鮮さの3つである。たとえば、Twitterで1日に流れる情報量は12TBともいわれるように、極めて大量なデータを扱う。テキストや画像、音声といった多様な非定型データが、解析技術を用いて構造化されたデータに落とし込まれ、さらに、情報は逐次アップデートされていて、現在のデータを使って何らかの意思決定を行っていくという特徴がある。

ハード、ソフトともに処理能力が向上し、大量の非定型データを分散システムで高速に処理できるようになったことで、ビジネスの可能性は大きく広がっている。しかし、実際の活用事例はまだ限られているため、企業としても取り組むチャンスは大きいといえる。

2. ビッグデータによる豊かな社会の実現

2012年3月、IPAの「くらしと経済の基盤としてのITを考える研究会」は、「つながるITがもたらす豊かなくらしと経済」という報告書を発表した。ここでは、ビッグデータを利用したサービスの利便性や脅威を「価値の創造」と「信頼の基盤」という2つの柱に分けてまとめている。

「価値の創造」に向けては、人材育成と社会基盤の整備が求められる。たとえば政府機関は非常に大量のデータを持っているが、単純にすべてを公開するというわけにはいかないので、どのような形で民間に提供し、うまく利用できるようにするかということが大きな論点となっている。

「信頼の基盤」に関しては、セキュリティと信頼性・安全性の確保が求められる。ビッグデータは情報の取り扱いが非常にセンシティブであるため、守られるべき情報がきちんと守られるような対策が必要となる。さらに大きな問題として、「意図せぬ情報提供」がある。たとえば、Twitterの情報を追っていくと、本人が意図していなくても、個人の生活リズムが把握できてしまうことがある。それを何らかのマーケティングに使うこともできるが、使う側としては、そこに問題がないかを慎重に判断した上で扱う必要がある。

3. 攻めのITに関するキラーコンテンツ・アプリケーションとしてのビックデータ

日本企業は米国企業に比べ、データを活用してアナリティカルに経営判断をしていく取り組みが遅れているといわれる。この真偽を確かめるために、日米韓の上場企業に対し、「IT戦略と企業パフォーマンスに関する日米韓の国際比較」というインタビュー調査と質問票調査を実施した。

この調査結果から、経営戦略におけるIT戦略の位置付けが明確である企業の割合が、日本は米国よりも低いことが分かった。また、日本企業では、最高情報責任者(CIO)が置かれてはいるが、その多くが兼任であるのに対し、米国企業は専任のCIOを置き、経営会議でビジネス上の問題点に技術的な観点から解決策を提案しているという違いがある。

さらに、日本企業も米国企業もITを生産性向上のために利用しているが、その方向性は全く異なっている。労働生産性とは従業員1人当たりの付加価値額なので、企業の総付加価値(粗利)を従業員数で割ったものと考えることができる。日本企業は、ITを効率化のツールとして使う場合が多い。つまり、基幹系システムにITを導入し、業務効率化や人員削減を行い、分母を減らすことによって生産性を上げるという方向である。それに対して米国企業は、ITを競争力強化のツールとして活用している。すなわち、情報系システムにITを導入し、新規顧客の獲得、既存顧客の維持、企業戦略の策定などを行い、分子を伸ばすという方向である。ITは経営効率化のための極めて重要なツールではあるが、同時に、企業としての付加価値を高める用途にも目を向けるべきだといえる。

一方、IPA報告書によると、ビッグデータの用途として最も多いのが「経営戦略、事業戦略の策定」、2番目が「顧客サービスの向上」、3番目が「販売促進・見込み顧客獲得」であり、ビッグデータは明らかに攻めの方向のキラーアプリケーションだといえる。それにもかかわらず、今まで日本の経営者がITを効率化のツールと見なしてきたのは、ITの事業貢献が明確化されていなかったからだ。業務効率化によるROIの向上はすぐに分かるが、ITの導入によって売上が上がるということが見えるようになると、データを使ってビジネスをつくっていくということが企業の中に広がっていくのではないだろうか。

4. データからの価値創造人材:データサイエンティスト

ビッグデータへの関心が広まるにつれ、それらを扱う「データサイエンティスト」への注目が高まってきている。グローバル化の進展も相まって、企業の経営戦略の抱える問題も非常に広範化している。その中では、顕在化した具体的な問題に対して解決策を提示する人材ではなく、より広い問題設定に対して、何が分からないのかを分かるようにする、あるいは、自ら課題設定しながら広範なデータの中から価値を見つけ出すことのできる人材、つまり「データサイエンティスト」が必要になってくる。このような人材がいなければ、いくら良いデータがあっても価値にはつながらない。コンピュータが高度化し、大量のデータを高速に処理できるようになったとしても、そこから価値を取り出すのは人なのである。

パネルディスカッション

モデレータ:田中 芳夫 (東京理科大学大学院イノベーション研究科 教授/産業総合研究所 研究参与)

政府系データの解放・融合

仲田 雄作 (独立行政法人 情報処理推進機構 理事)

政府や自治体の持つ公共的なデータをビッグデータとして活用することで、新たな産業を生み出すイノベーションを図ることができる。政府は各種観測情報、統計、調査報告書、法令など、さまざまなデータを持っており、これらは現在でも公開されているが、二次利用が難しいPDFなどの形で公開されていたり、統計データのフォーマットが十分でなかったり、あるいはどこで公開されているのか分からないなどの問題がある。オープンガバメントの一要素としてオープンデータを実現するには、データのフォーマットやライセンシングポリシーなどを統一し、匿名化やプライバシー保護の技術を適用したプラットフォームを構築する必要がある。

IPA・産総研は、こうしたプラットフォームに関して、ガイドラインの策定や、技術的側面からの支援、あるいは米国やEUとの国際連携のハブとしての役割を果たすことができるのではないかと考えている。

ビッグデータ・オープンデータとビジネス―政府・独立行政法人への期待

坂下 哲也 (一般財団法人 日本情報経済社会推進協会 次長)

欧米ではビッグデータ関連のさまざまなビジネスが生まれており、たとえば地質情報と国が持つ耕地データや収穫高データを使った農業保険のビジネスが成立し、3年間で10兆円産業にまで成長している。日本においては、アナログの地質データなどをデジタル化し、水環境モデルを使ってコンサルテーションを行うベンチャーも出てきている。

また、IT戦略本部が「電子行政オープンデータ戦略」を策定・公表したことにより、政府での取り組みも活発化している。特に期待されるのが経済産業省(METI)のDATAMETI構想である。METIの中でハンドリングできるものが1つにまとまれば、約款やデータフォーマットが一律化され、民間のデータへの到達コストが圧縮できるため、新たなビジネスが生まれる可能性がある。

また、オープンデータというのは、リンクが張られて初めて価値が生まれる。たとえばMETIの統計データの中の企業名と法務省の法人登記データとリンクを張れば、その企業が存在することが機械的に分かる。場所の名前も、総務省の地方公共団体コードとリンクできれば機械判読ができるようになる。このようなことがDATAMETI構想の中で実現されることを期待している。さらに、さまざまな情報に対して目利きをするアグリゲーターの育成も重要である。ニーズに応じて必要なデータをピックアップし、分析するというサービスも今後は必要になるだろう。

しかし、情報の解析に必要なスキルや人材は、事業者の中でも不足している。そのため、民間事業者が持つ情報を独立行政法人などが解析・分析し、その結果を事業者に戻す仕組みが考えられる。また、今、民間事業者の持つ個人情報を分析する際には、ライセンス供与により事業者同士がデータをやり取りしているが、そこにはガイドラインもなければ、標準フォーマットやツールもない。プライバシーマークを付与しているJIPDECは、そこにある程度たがをはめることができるので、技術的な部分を産総研をはじめとする独立行政法人に期待したい。

産業技術総合研究所のポジション

関口 智嗣 (独立行政法人 産業総合研究所 情報通信・エレクトロニクス分野 副研究統括)

産総研はこれまで、研究データを提供するデータプロバイダーと新技術を提供するテクノロジープロバイダーという両面で活動してきたが、それだけでは公的データの利用を加速することはできない。ビッグデータへのアプローチも、テクノロジーを出していくだけではいけない。プラットフォームという形でデータとテクノロジーを統合したものをセットすることで、社会にアプローチしていきたいと考えている。

ディスカッション

オープンデータの活用拡大に向けて

田中: オープンデータの活用を拡大するには、どのようなことが必要になるか。

仲田: 米国やEUは、透明性の向上による民主主義の向上と経済の活性化によるイノベーションの進展という発想に基づき、オープンガバメントに積極的に取り組んでいる。日本では今年(2012年)7月に、IT戦略本部が基本的な方向性として4つの原則を出しているが、特に重要なのが、機械判読可能で、かつライセンシングも含めて二次利用可能な形でデータを公開することだ。現在はPDFなど人間が読む前提で情報が公開されているので、それを二次利用が可能な形で提供するだけでも新しいサービスが多く生まれてくるのではないか。

坂下: 欧米では、行政がつくった情報に著作権はなく、国民が自由に使うことができ、それを使って起きた問題に対しては使用者が責任を取るということが明確になっているが、日本はそこまでは至っていない。情報は自治体の財産であり、無料では公開できないと主張する自治体もある。制度的な枠組みから違っているという認識を持っている。

関口: 共有化のためには、データを出すためのフォーマット、意味付けするためのスキーマ、アクセスするためのプロトコルの標準化などが必要である。地理情報などのように既に標準化が進んだデータについては普及方法を、非構造的なデータに関しては標準化する手法を開発していく必要がある。

元橋: 政府の持つ情報はできるだけ自由に使えるようにすべきだが、企業は自社所有の情報はキープしたいと考える。そうでなければ差別化が図れず、価格競争に陥ってイノベーションが生まれなくなるからだ。したがって、制度設計の際には一律に公開とするのではなく、オープンとクローズのバランスを考慮しなければならない。

一方で、どの情報を持っているかではなく、オープンな情報をどう解析するかというところでも差別化は図れる。そのための人材育成に政策的支援を投入すれば、付加価値が広がり、ビッグデータのマクロ経済効果は飛躍的に向上するだろう。

田中: 欧米のように、オープンデータを解析するビジネスは、日本ではどこまで可能性があるか。

坂下: 日本では、持っている情報をすべて横断的に解析して個人のプライバシーを明らかにすることには問題があるとして、やっていないようだ。ただ、米国では未成年のデータと金銭や医療に関わる情報は扱わないとした上で、横断的に解析している。日本でも視点を変えればうまくいくだろうし、データのアグリゲーションができる人材を育成するのも手ではないか。

データサイエンティストの人材育成

田中: 膨大な情報から必要なデータを集めるスクリーニング手法について、何かアイデアはないか。

関口: 単なるビット列のデータをフィルタリングし、コンテンツに加工し、さらにほかの人が利用できるようにリソース化して価値を付けていくということが、まさにデータサイエンティストの役割である。その育成・供給については大学だけに任せず、産総研やIPAがパートナーシップを組んで、社会人再教育も含めて行っていくべきだろう。

仲田: 今後必要なのは、単一分野のエキスパートではなく、全体を俯瞰できる統合人材である。特にビッグデータの時代になると、技術だけでなく数理統計や制度の知識も持っていなければならないが、今の大学教育でそれを行うのは困難だ。そうした人材を定義付け、かつニュートラルに測定できる指標の作成に向け、検討を進めているが、ビッグデータというのはオンプロセスなので、定義や指標ができあがるには相当の時間がかかると思われる。

元橋: 大学だけで何かをするのではなく、企業や公的研究機関と組んでいけるような形が必要ではないか。文部科技省とMETIの壁、あるいは大学の設置趣旨など、法令的なハードルがあるのかもしれないが、日本の国としての組織の設計も考えていかなくてはならない。

坂下: 米国では人材育成を迅速に行うため、情報を提供してアルゴリズムをつくらせる賞金付きコンテストを実施している。また、事業者の立場からすると、データの調達コストと加工コストを圧縮したい。前者についてはまさにオープンデータの話で、官が持つ情報を機械判読可能な状態で出していく必要がある。後者については、研究機関が用意したガイドラインなどに民間が参加していく形が現実的には一番短期間でできることではないか。

制度・政策への提言

田中: 最後に、日本の環境を踏まえて制度や政策に対する提言をいただきたい。

仲田: 政府の決定で、目的の営利・非営利を問わず積極的にデータを提供するという原則が打ち出されたが、海外の状況を見ても、制度設計や基本原則ができてもコンテンツが急激に充実するわけではない。逆に言えば日本も今からキャッチアップできるので、今後は提供を前提としてデータを整備していくとともに、データ提供のポリシーを策定し、オープンデータを加速する努力を政府全体でしていく必要がある。

坂下: オープンデータを進める上で障害になっているのが、財産権と著作権である。欧米は、行政機関が持っている情報は税金によってつくられたもので、政府は預かっているだけだから、公開するという考え方を取っている。また、技術と制度は表裏一体なので、技術をつくるだけではなく、ルールも時代に合わせて改正していくことで、社会が良くなっていくと思う。

関口: 現在、日本ではITが経営戦略に使われていないが、ITが主導するような環境になって欲しい。無償提供に対する抵抗がある一方で、有償提供の場合はお金を集めるためにコストがかかりすぎるという問題があるので、決済方式についても技術開発の必要がある。

元橋: 国はデータを預かっているだけといっても、データには提供者がいる。個人情報や企業の情報を競合にオープンにするのは難しいため、二次利用の問題についても考えていかなくてはならないだろう。

田中: 日本は、ITをツールと考えているのか、戦略の手段と考えているのかがはっきりしない。日本企業でもようやくCIOが置かれるようになったが、きちんと役割を果たせる人材が育っていないようにも思う。最後は人材の問題なので、産総研もIPAも、今後はリテラシーの向上に取り組んでいかなければならない。