開催日 | 2025年2月20日 |
---|---|
スピーカー | 栄藤 稔(大阪大学先導的学際研究機構教授) |
コメンテータ | 内田 了司(経済産業省 商務情報政策局 情報技術利用促進課長) |
モデレータ | 木戸 冬子(RIETIコンサルティングフェロー / 情報・システム研究機構 特任研究員 / 東京大学 特任研究員) |
ダウンロード/関連リンク | |
開催案内/講演概要 | AI技術は、言語、画像、音声を認識する「Perception AI」から、文章、画像、音声を新たに生成する「Generative AI」へと進展し、近年では、生成AIを業務フローに統合した「Agentic AI」へと発展してきた。こうした潮流の中、NVIDIAのジェンスン・ファンCEOは、先日開催された米国の先進技術見本市「CES 2025」において、「Physical AI」、すなわちロボティクスが今後の技術革新の中心となることを強調した。本セミナーでは、大阪大学先導的学際研究機構の栄藤稔教授を迎え、AI革新が社会システムに及ぼす影響、およびそれに伴う倫理的・社会的課題について多角的に考察いただいた。 |
議事録
AI技術に国境はない
今日は、生成AIとフィジカルAIというロボティクスにより、どのように産業構造が変わっていくかに関して話題を提起できたらと思います。まず、学会の状況です。機械学習分野における主要な国際学会であるInternational Conference on Machine Learning (ICML)には、数千人強の参加者が集まります。この会議での口頭発表論文の著者202名の氏名を生成AIで解析してみると、ほぼ半数が東アジア由来の氏名となっています。
この傾向は、深層学習で著名な会議であるNeural Information Processing Systems (NeurIPS)や、画像認識のトップカンファレンスであるInternational Conference on Computer Vision (ICCV)においても同様です。東アジア出身の研究者をはじめ多様な国と地域の人々が重要な役割を担っています。これは、AI研究がオープンソースやオープンデータを基盤として急速にグローバルへ広がる特徴を持っているからだと考えられます。
今、AIは研究と事業が密接につながっており、国際学会で成果を上げた博士課程の学生がそのまま実務にも直結して活躍する構造が生まれています。日本の場合、修士課程の学生が論文執筆の中心になることが多く、また博士号取得後の待遇やキャリアパスに課題も見られます。一方、米国や中国では博士号取得者が比較的高い報酬と明確なキャリアパスを得やすい状況にあり、それが研究開発をさらに推進する好循環を生んでいます。
AI技術そのものに国境はありません。これが他の技術分野と異なる特徴で、オープンソースやオープンデータによって技術は一気にグローバルで広まっていきます。
AI研究においては中国の理数系教育の強さが反映され、彼らが圧倒的なパワーを示しています。最近は国際的な共同研究が一般的となっており、これは日本の大学も見習うべき点です。国際的な研究を通じてグローバルに連携を深め、さまざまなところにアンカーやフックをかけておくことが大事です。
また、AIの世界では言語的な障壁は比較的低く、複数の文化圏からの参加者が混在していることが標準的な状況となっています。こういった環境に適応するためにも博士課程人材の確保は重要で、キャリアパス設計のグローバル化が不可欠となります。
AI技術の変遷
現在のAIが非常に盛んになったのは2011年頃からですが、14年ほど前に深層学習が実用化されるようになりました。2015年頃には画像認識の性能が高まり、その後に登場したのが機械翻訳です。その発端となったのがGoogleのトランスフォーマーという技術ですが、入力と出力の関係を3つのベクトルに分解して学習を行います。
機械翻訳では、例えば日本語と英語といった言語の対応関係を学習する必要がありましたが、コンピュータが同一言語のWebページを読むだけで自己学習して、次の文章を当てっこするという大規模言語モデル(LLM)が登場し、その後、マルチモーダル化という形で画像認識技術へと発展してきました。
このマルチモーダル化というのは2年ほど前にソフトバンクの孫氏が盛んに言われていたことですが、今日の技術的なトピックは、NVIDIAのCEOであるジェンスン・ファン氏が2025年1月にConsumer Electronics Show (CES)で提唱した「Physical AI」です。
音声認識、画像認識、機械翻訳といったこれまでの技術は「Perception AI」という認識するAIだったわけですが、2023年頃からは「Generative AI」という生成AIが登場し、2025年からは生成AIを業務フローに組み込んだ「Agentic AI」が広まりつつあります。しかし、ジェンスン・ファン氏は、われわれが目指しているのはフィジカルAIだと言っていて、これは生成AIの技術をロボット制御に応用するロボティクスのことを指しています。
Sim-to-Realの進展
本日お話ししたいのが、中国のUnitreeというロボットの会社です。ここがサービスロボットのリーダーとしてドローンメーカーのリーダーであるDJIと同様の地位を獲得するのではないかと思っています。中国とって期待の会社となります。
製造業とAIという2つの「&」を持つ国は、日本、ドイツ、中国ぐらいだと思うのですが、最近は中国が先行しつつあります。Unitreeは2016年に設立したロボティクスのスタートアップ企業で、中国の杭州を拠点としています。そこには元気のよいスタートアップが6社あり、中国政府は彼らを「小六龍」、6匹の小さなドラゴンと称しています。
中国では、製造業の深圳、首都の北京、そして上海の3つがイノベーション拠点地域の座を競り合っているように見えます。杭州は上海から高速鉄道で1時間足らずのところにあり、景観が美しいながらも住居費は北京の半額程度で、上位10%の給与は年収100万元 (約2000万円)と、米国の教授にも匹敵する水準です。加えて、浙江大学を中心とした研究型大学によって、実学志向の産業クラスターができつつあると聞いています。
フィジカルAIを計算環境整備の観点でリードしているのはNVIDIAですが、その果実をロボティクスの実現として受け取ろうとしているのがUnitreeです。現在、ロボットの歩行訓練はメタパース上のサイバースペースで行われ、極めて安いコストで試行錯誤ができる環境にあります。もともとNVIDIAはGPU等のグラフィックスの会社だったこともあり、こういったロボットの訓練もメタバース上で行っています。
これまではコンピュータグラフィックス上の世界と現実環境には隔たりがありましたが、Sim-to-Real(メタバースの学習結果を実空間に移転させること)によってより高度なシミュレーション環境が提供されています。NVIDIAが開発した「Cosmos」は、生成AIを用いることでロボットの学習をより視覚的に見ながら、メタバースにおいて低コストで訓練が行えるものを提供しています。こういった画像認識技術を活用した多関節ロボットの制御訓練は大規模言語モデルによるモデル化も始まっているところです。
産業用ロボット vs. サービスロボット
フィジカルAIとは、言い換えれば、「身体性を持った汎用AI」の登場ということになります。現在、五感と身体操作との統合がされているところですが、それらとインテリジェンスを結び付けていった先に意識が構成学的に定義できるのではないかと議論されています。 5年前には想像もつきませんでしたが、今ではそれが基調となっています。
Unitreeはもともと四足歩行ロボットの開発に取り組んでいましたが、最近は高性能アームや人型ロボットの開発も行っており、それらは日本でも購入可能です。今のところ、使用感はラジコンレベルですが、おそらく2年後には見回りや建設現場の作業補助ができるようになると思います。
ここで行われているオープンソースやオープンデータはあっという間に世界中にシェアされていき、多くの人がその学習を行えるので、そういった意味では、日本にもAI技術を開発し、キャッチアップしていくチャンスは残っていると思います。
ただ、重要なのは部材、ハード面です。今、中国製造業には大きな成長力が見込まれます。
今のUnitreeは民生品を標榜しているのでまだ防塵防水はできていませんが、これが克服されると、Boston Dynamics並みの用途に近づいてくると思います。
ドローンメーカー世界最大手であるDJIが勝てたのは、充実した部品調達網、巨大な中国市場、教育制度と人材プールによる技術者の大量育成に加えて、政府の支援政策が効いていると思います。産業ロボットは自動車製造や半導体製造に使われるものですが、最近はサービスロボットのマーケットが大きくなっています。
私がロボティクスに注目するようになったのは、Webデータがもうほぼ掘り尽くされているので、ロボティクスが自らメタバースの中で勝手に動いてデータを作るため、強化学習を通してロボットが成長していく方向がAIの次の出口になると見ていたからです。
2年前に上海の展示会でイヌ型ロボットを見たのですが、20社近い企業がイヌ型ロボットを作っているような状況でした。上海の周りに30社ほどのユニコーンが集まり、部品メーカーも一緒になってロボット開発を行っているようなイメージです。
日本は長らくアクチュエータ技術が非常に強く、特にハーモニックドライブを作れるのは日本とドイツくらいしかないと聞いていますが、サービスロボットの需要が増えれば、安く民生機を作っていかなければなりません。現在、ファミリーレストランで使われている配膳ロボットは100%中国製であることから分かるように、民生用途では中国製ロボットの導入を考えていく必要があります。
シンギュラリティは来るのか
シンギュラリティに関してはさまざまな定義がありますが、私は、AIによるAIの自動生成・進化という方向で、AIがAIを作り出すことを一番懸念しています。ロボットは住む世界を定義されれば、その中で強化学習を行う、つまり、自分たちで勝手に学習していくので、革新的な変化が起きてくると思います。
イノベーションの核になっているのはAIですが、本当にAIと何を掛け合わせていくかという議論に来ていて、より自動化を進めていく必要性があります。そうすると、われわれの世界はAIが混在した情報社会になっていきます。
IoTやロボティクスで社会を変えていくわけですが、一番欠けているのがセキュリティの視点だと思います。さまざまなインテグリティのチェックを行った上でガバナンスを実装し、社会の在り方や倫理のもとに、モデルの正当性、実装の透明性、セキュリティ強化を進めていくことが日本としても必要ではないかと感じています。
他国のAIモデルも活用できますし、日本には有能な技術者もいるので、そういったデータを使えば日本でも良いものが作れると思います。そのときにやはりセキュリティがボトルネックになるので、そこはぜひ考えていただきたいと思います。
AIに関するセキュリティポリシーの策定と実装においては、何を取り込み、何を出してはいけないのかという、ガードレール機能が不可欠です。ホワイトリスト形式で一部の企業のサービスだけ使えるということですと、それは、まるで江戸時代の鎖国と変わりません。ロボティクスは社会インフラに入ってくるので、そこが極めて重要になってきます。ですので、いかに部材を確保しながら回していくかという視点が重要です。
AI技術には国境がないので、グローバルで世界のAI開発の一員となっていくとともに、人材のプールも進めていくことが大事です。日本が得意な部材、例えば精密減速機やCMOSでの優位を確保しながら、世界の部材を使っていくことが重要で、そのためにはIoTセキュリティが重要になります。
コメント
内田:
フィジカルAIを起点として、非常に広範な論点が提起されたと思います。コメンテータの特権で、1点質問をさせていただきます。
AI開発力に関しては日本も十分可能性はあると期待しています。経済産業省では2000年より「未踏事業」を通じてトップIT人材の育成を続けており、数多くのAIスタートアップが未踏修了生によって立ち上げられています。他方で、そうしたコミュニティの規模面では、中国に比べるとまだ小さく、また、優秀な人材が社会でその実力を発揮できる環境、例えば報酬面においても差異があるとのお話しでした。加えて、スタートアップが優れた技術を提供できても、ユーザーたる日本企業がそれを実装しない、またスタートアップ単独でもなかなか社会実装できない状況があります。一方で、米国や中国では社会実装が急速に進んでいきます。そうした、先生がご覧になった彼我の差について、もう少し教えていただければと思います。
栄藤:
博士が大事だということですが、その目的が大きく異なります。日本の場合はどうしても研究したい人や社会に出ることが難しい人が博士課程へ進む傾向があるので、AI研究者となり、年収2000万円規模のキャリアパスを目指す人はほとんどいないというところが大きいです。ですので、根は深いですよね。
日本では大企業が新しいスタートアップのプロダクトをリスクととらえて、積極的に買わないため、結果としてスタートアップはプロダクトが作れません。未踏事業はうまくいっているほうだとは思いますが、エコシステムそのものを根底から再設計しない限り難しいと感じています。プロダクトを受け入れる産業界と、そうしたプロダクトを開発する企業に入る学生たちという、これらの出口設計が一番重要だと思います。
この議事録はRIETI編集部の責任でまとめたものです。