ノンテクニカルサマリー

大規模論文データを用いたリサーチデータ公開のインセンティブに関する実証研究

執筆者 KWON Seokbeom (東京大学)/元橋 一之 (ファカルティフェロー)
研究プロジェクト デジタル化とイノベーションエコシステムに関する実証研究
ダウンロード/関連リンク

このノンテクニカルサマリーは、分析結果を踏まえつつ、政策的含意を中心に大胆に記述したもので、DP・PDPの一部分ではありません。分析内容の詳細はDP・PDP本文をお読みください。また、ここに述べられている見解は執筆者個人の責任で発表するものであり、所属する組織および(独)経済産業研究所としての見解を示すものではありません。

イノベーションプログラム(第五期:2020〜2023年度)
「デジタル化とイノベーションエコシステムに関する実証研究」プロジェクト

公的資金によって行われる科学研究の成果については、論文として幅広く公表することで幅広く社会に還元することが求められている。最近では、学術誌の購読料が高騰してきており、論文の公開にあたっては当該論文をオープンアクセス(無料で論文をダウンロードすること)とすることを推奨する動きが広がっている。この「オープンサイエンス」の流れの中で、科学研究における実験や観察から得られたデータについても論文と同時に公開することで、科学技術の一層の振興をはかろうとする動きもある。例えば、米国のNIHは、研究助成の申請書とともに、研究から得られたデータに関するデータ管理計画(DMP, data management plan)の提出を求めており、研究データを公共財として位置づける方針は日本も含めた各国において広がっていくと考えられる。

しかし、研究に用いたデータを公開することは、当事者である研究者にとっては、当該研究分野における研究競争が高まり、将来的な自身の研究業績に対して負の影響をもたらすことが想定される。ただ、その一方で、研究データを公開することで、自身の研究分野に対する周囲の関心が高まることで、引用などの面でポジティブな効果も期待できる。従って、実際に個々の研究者がデータを公開するか否かの判断は、この負の効果(競争効果)と正の効果(クレジット効果)のバランスによって決まると考えられる。本研究においては、Web of Science(クラリベート社)の大規模論文データベースを用いて、この両者のバランスについて実証研究を行った。具体的には、2010年に公表された約30万件の論文について、データ公開された論文とそうでない論文がどの程度他の論文に引用されているかについて回帰分析を行った。

下図は回帰分析の結果を論文引用に関するダイナミックモデルに当てはめて、競争効果とクレジット効果の度合いを論文公開からの年数ごとに見たものである。論文の公開後、正のクレジット効果は徐々に上昇し、3年後にピークを迎えた後減少傾向に転じる。一方で、負の競争効果は年を追うごとにマイナス幅が大きくなることが分かった。この両者を併せたネット効果は、短期的には正であるが、5年後以降は負に転じることになる。つまり、短期的なクレジット効果を期待したい研究者においては、データを公開したいという誘因が働くが、長期的な効果を優先したい研究者(例えば若手の研究者)はデータの公開を避ける傾向にある。また、論文の掲載誌のインパクトファクターとクレジット効果は補完的な関係にあることが分かった。つまり、クオリティの高い研究成果においては、データ公開の誘因がより強く働くということである。

公的な資金で行われた科学研究におけるデータを公共財として位置付け、競争効果によって当該研究に費やされた研究資金の社会的な効率性を高めることは公共政策の観点からは適切な方向性といえる。しかし、データ公開に関するポリシーの策定にあたっては、研究者におけるデータ公開に対する誘因と整合的なものとすべきである。本研究における結果は、学術領域によらない平均的な状況を示したものであるが、クレジット効果と競争効果のバランスは研究分野や内容(基礎的研究か実用化研究かなど)によっても異なる可能性が高い。従って、ファンディングエージェンシーや研究プロジェクトのタイプによって詳細な検討を行うことが必要である。

図:回帰分析結果を用いたデータ公開における競争効果とクレジット効果の分解
図:回帰分析結果を用いたデータ公開における競争効果とクレジット効果の分解