ノンテクニカルサマリー

Gradient Boosting Tree法による中国特許データの発明者識別と発明者の地域間異動(1985-2016)

執筆者 尹 徳雲 (東京大学)/元橋 一之 (ファカルティフェロー)
研究プロジェクト IoTの進展とイノベーションエコシステムに関する実証研究
ダウンロード/関連リンク

このノンテクニカルサマリーは、分析結果を踏まえつつ、政策的含意を中心に大胆に記述したもので、DP・PDPの一部分ではありません。分析内容の詳細はDP・PDP本文をお読みください。また、ここに述べられている見解は執筆者個人の責任で発表するものであり、所属する組織および(独)経済産業研究所としての見解を示すものではありません。

イノベーションプログラム(第四期:2016〜2019年度)
「IoTの進展とイノベーションエコシステムに関する実証研究」プロジェクト

特許情報はイノベーションの研究を行う上で貴重なデータソースとなっているが、ここでは中国特許における発明者情報から同一発明者の識別を行う作業を行い、その結果に基づいて発明者の地域的な流動性に関する記述統計を得た。同姓同名が多い中国人の名称について、特許情報として明らかになっている発明者名称のみから、複数特許の発明者として同一人物を特定することは困難である。ここでは教師データ付きの機械学習の手法を用いて、個々の特許の属性(出願人、出願人住所、技術分類、共同発明者名など)を用いて、複数の特許に出現する同一発明者氏名が、同一人物によるものか異なる人物なのか(同姓同名)を識別するモデルを作成し、中国特許情報(知識産権局が公開する1985年〜2016年までのデータ)の発明者識別作業を行った。

このデータを活用することで、同一発明者(研究者)の所属機関や地域間異動の情報を得ることができる(同一発明者が関与する複数の特許で出願人住所が異なる場合に当該発明者が地理的に移動したと考える)。下図は中国全土で発明者の増減を省別に見たものである。ここでは、赤は研究者が増加した省(流入が流出を上回る)で、青は逆に減少した省(流出が流入を上回る)である。まず、全体として、北京、上海、広東省といった特許数が比較的多いイノベーション活動が集中している省(市)から、その周辺の省、特に江蘇省、浙江省といった華東地域に研究者移動が見られる。また、四川省などの内陸部においても入超の省が存在する一方で、遼寧省、吉林省、黒竜江省といった東北3省からは流出している姿が浮かび上がっている。また、本稿においては、北京、上海、シンセンの3つの都市を比較した分析も行っており、最近、中国におけるイノベーションハブとして注目を集めているシンセンには、北京や上海といった大都市から大量の研究者が流れ込んでおり、また研究開発型ベンチャー企業(特許出願期間が5年未満の企業)の割合が高いことが分かった。

図

このように、中国においては北京と上海に集中していた研究開発活動が、シンセンや周辺地域に分散している姿が明らかになっている。政策インプリケーションとしては、イノベーション活動が活発化しているシンセンや蘇州(江蘇省)、成都(四川省)などの地方における情報収集活動を活発化させ、日本企業に対して的確な提供を行っていくことが求められる。日本企業が中国におけるイノベーション活動のダイナミズムを的確に取り込むための地方政府との協力を戦略的に推進することも重要であると考えられる。