「知の構造化」学術俯瞰マップ

開催日 2007年3月9日
スピーカー 松島 克守 (東京大学大学院工学系研究科教授)
モデレータ 坂田 一郎 (RIETIコンサルティングフェロー/経済産業省経済産業政策局政策企画官)

議事録

急激な知識量の増大が招く弊害

今日、情報や知識の量が急増する中で多くの人が情報に溺れ、知識に飢えるという現象が起きています。たとえばGoogleで「無料医薬品」を検索してみるとヒット件数は276万件、「CSR」では日本語サイトだけでも2800万件に上ります。このような膨大な量の情報から必要とする情報を得るのは至難の業です。われわれが行なう研究は検索エンジンとは異なる発想で知識の有効利用を目指すものです。

学問領域では専門分野の細分化が進んでいます。かつては「生物学」、「化学」、「物理学」といったように一括りにされてきた領域でも、現在では、生物学を例にとっても「分子生物学」、「生態学」、「細胞生物学」と幾多の分野に細分化され、生物学全般を語れる人の数は非常に限られてきています。同じ学問領域にあっても領域内の他の分野で何が起きているのかは把握できず、このことは大学内でも深刻な問題になっています。

このような状況では学問知識を社会で活用することはできません。一例をとって考えてみましょう。1999年11月、H-2ロケット8号機の打ち上げが失敗しました。機械工学では薄板圧延材が大型鍛造材より丈夫なことが常識になっているにも関わらず、ロケットの設計者は国立航空宇宙局(NASA)が公表している薄板圧延材の破断実験データを基に大型鍛造材で設計してしまったのです。

「知の構造化」とその手法

産業技術総合研究所の吉川理事長によると基礎研究は2段階に分けることができます。学問分野での知の深化が進むのが「第1種基礎研究」。しかし知識は単独では社会や産業のニーズに応えることはできません。そこで「第2種基礎研究」で科学知識の統合によるイノベーションを目指すという考えです。知の構造化が行なわれるのはこの第2種基礎研究段階です。

知の構造化にあたっては従来のデルファイ法では処理しきれないため、大量情報処理を可能とするIT技術を組み合わせ、テキスト分析と引用分析(Inter-citation)を行ないます。学術論文の筆者は既存の研究を参照しながら新たな研究課題を設定します。われわれは引用分析によりこのような論文間の引用関係を明らかにし、学問の俯瞰を試みました。

Sustainabilityの重要性

今日、Sustainabilityの重要性が高まっています。Sustainabilityは学際的領域なので領域全体を把握するには異分野間の専門家の連携が必要となります。たとえば二酸化炭素削減の研究で海中に炭酸ガスを溶け込ませるにしても海洋生物の生態に配慮する必要があり、分野をまたがった包括的な視点でSustainabilityを追求することが求められるようになっています。

そこでWeb of Science(引用文献データベース)で「sustainab*」というキーワードでヒットした3万件の学術論文を対象にSustainabilityの俯瞰を試みました。まずは頻繁に引用しあう集団(クラスター)をコンピュータ処理で分析します。次に上位15個のクラスターに属する論文を実際に読み、クラスターの名称設定を行ないました。分析結果は以下の通りです。

最大クラスターはAgriculture、2位はfisheries、3位はEcological Economies、4位はForestry(Agroforestry)、5位はForestry(Tropical Forestry)でした。4位と5位は共に森林学ですが、学派が違うので引用関係は弱まります。6位のBusinessは経営としての持続性が含まれるため対象から外します。7位はTourism、8位はWaterです。農業や水産等の他分野で水に関する引用が少なく、Sustainabilityの研究では水が独立して取り上げられているのは興味深い点です。9位はForestry(Biodiversity)、10位はUrban Planningで、ヒートアイランドや廃棄物の問題でSustainabilityが議論されているようです。11位はRural Sociology、12位はEnergyでしたが、Energyの順位が低いのは意外です。13位はHealth、14位はSoil、15位はWild Lifeで、野生動物の生態系破壊を問題にしています。

分析の結果、Sustainabilityの分野ではクラスター間の引用関係が弱く、学術知識が統合されていない様子がわかりました。

研究の最先端では、このような引用分析と自然言語分析と組み合わせ領域の全体像を捉える試みが進められています。

時間軸に沿った下位分野の分析

たとえばEnergyでも太陽電池や燃料電池といったより狭い分野ではある程度の全体像は把握できるので、これをさらに時間軸で切ると、エマージングな分野を特定することができます。

燃料電池の分野を時間軸で区切ってみると、新エネルギー・産業技術総合開発機構(NEDO)が作成した燃料電池開発に関するテクノロジーロードマップと、われわれの分析の結果把握できたエマージングな分野の間で、殆どの項目が一致していることがわかりました。テクノロジーロードマップは基本知識としての学術論文、特許、製品という3層構造になっていますが、学術論文で行なったような引用分析を特許でも行なえば企業動向を把握できます。たとえば燃料電池に関する特許の引用分析では、約10年前からハイブリッドの特許を出しつづけているのはホンダとトヨタ自動車の2社のみという結果が出ています。

知の構造化の期待成果と経営戦略の視点

知の構造化は巨額をかけて得られた貴重な科学知識が社会の要請に応えられていないという問題の解決にもつながります。

今回紹介した学術知識を俯瞰する方法には以下のような応用が考えられます。

(1)知識表現のモデル定式化
(2)テクノロジーロードマップの作成(インテンション主導でロードマップを作るのでは高いリスクが伴いますが、上記の方法を用いることで、技術動向を把握した上で合理的にロードマップを作成できるようになる。)
(3)知識のポータルサイト提供
(4)学術的に利用できる高度な検索エンジンの構築
(5)オントロジーの作成

論文の引用分析によって分野の中心課題を把握できれば、教員は学生に論文を薦める際に、恣意的になることなく当該分野で鍵となる論文を薦めることができるようになります。これは学生の早期スタートアップにもつながるでしょう。

さらに、膨大な情報を抱えている企業経営の分野でも以下のような応用が考えられます。

(1)経営情報の俯瞰的理解
(2)社内情報の価値化
(3)R&D戦略
(4)市場分析
(5)商品戦略
(6)マーケティング戦略
(7)知材戦略
(8)CSR・SOX法対応

経営学の学術論文の分析では、ITとリーダーシップ、ITと生産性を合わせて議論している論文は殆ど無いことがわかっています。

引用分析に関する補足

引用分析の図は論文一稿を示す点(プロット)と、引用関係を示す線で構成されています。プロットは図の中心に配置されている程、多方面から引用されていることを示し、分野における中心的なテーマを扱っていると考えられます。引用関係が弱い論文は図の周縁に配置されます。樹形図(テンドログラム)では結合しているのが下位レベルである程、関係が密であることを示しています。この図では上下左右の位置関係に意味はなく、逆さにしてもインプリケーションは異なりません。

質疑応答

Q:

文科系の論文で日本語の論文も含めてこのような分析をすることは可能でしょうか。また論文ではなく書籍の場合、専門分野と一般書籍の中間に位置する領域はどのように扱いますか。

A:

今回の分析は英語の論文のみを対象としています。日本語は別途の領域として分析すれば良いのではないでしょうか。
理系の世界では、重要とされる論文が掲載される雑誌は概ね特定できるので、研究ではそういったものを取り上げています。学術論文以外の媒体でも電子化されている資料を用いれば分析は可能だと考えます。
自然言語分析では、言語の違いに加え、術語の違いも問題になります。学会単位では用語統一が進んでいますが、学会が異なると同じ概念でも異なる術語を使っている場合があります。これを解決するにはシソーラスを作るほかありませんが、環境といった大きな分野ではシソーラスを作ること自体が一大プロジェクトになってしまします。引用分析では仲間内の論文を意図的に引用している場合が問題となります。たとえば引用が国内に限られている論文もありました。

Q:

引用数には、雑誌の急増に伴う投稿者の増加や分野における引用数の常識等、さまざまなバイアスが掛かるではないでしょうか。また、一時的に注目された後に消滅する分野があることを考えると、どこまで引用数を利用するかという点で知恵が必要ではないでしょうか。

A:

引用分析は全体像把握のための分析であり、個々の研究者を引用数で評価するためのものではありません。論文誌の増加に対しては、メジャーな論文誌のみを対象とすることで弊害を回避しています。また、われわれは大きなクラスターではなくエマージングなクラスターに注目しています。エマージングな研究は消滅する可能性もありますが、存在を把握すること自体がまず重要だと考えています。

Q:

論文になる前の議論が行なわれている場こそ「知」の最先端だと思いますが、このような場を把握しなければ、知の俯瞰はできず、限界に突き当たるのではないのではないでしょうか。

A:

「知とは何か」という哲学的議論は研究範囲外の問題です。また、われわれの研究ではある程度の質を持つ学術知識が集約された論文を前提にして、重要な知識は一流の学会誌で発表されるとの想定に立っています。実際に口頭で意見をいい合うことだけでなく、学会誌で論文を発表し、引用しあうことも議論の場に含まれると考えています。もちろん論文になる以前の議論は大切ですが、それは冒頭で説明した「第1種基礎研究」で深められる知識であり、われわれはそれを踏まえた「第2種基礎研究」で知の構造化を進めている訳です。

この議事録はRIETI編集部の責任でまとめたものです。