生成AIの研究開発と今後の方向性

開催日 2024年9月5日
スピーカー 花沢 健(NEC データサイエンスラボラトリー 所長 兼 生成AIセンター CTO)
コメンテータ 渡辺 琢也(経済産業省 商務情報政策局 情報産業課 情報処理基盤産業室長)
モデレータ 佐分利 応貴(RIETI上席研究員 / 経済産業省大臣官房参事)
ダウンロード/関連リンク
開催案内/講演概要

ChatGPTに代表される生成AIは、現在の経済社会の在り方そのものを大きく変革する「巨大な波」になるとして世界中で開発が進められており、日本国内でも、「AI戦略会議」においてAIの利活用やリスクに関する検討が進められている。グローバルジャイアントが生成AIの開発競争を主導する中、顔認証システム、DX支援、人工衛星など、多様な社会インフラを支えているNECは生成AIの開発にどう取り組んでいるのか。本BBLでは、NECデータサイエンスラボラトリー所長 兼 生成AIセンターCTOの花沢健氏に、日本企業が国産・自前で生成AIの開発に取り組む意義、そして国産AI開発の課題について解説いただいた。

議事録

連携が進むAIの研究開発

私は、もともと音声認識や音声翻訳の研究開発をしていまして、現在は生成AIを中心としたAI系の研究マネジメントを担当しています。弊社には、6つのビジネス部門と全社の製品開発を担うデジタルプラットフォーム部門があり、その下に研究開発から新事業開発、知財戦略までを一気通貫で担当するグローバルイノベーションビジネスユニットが設置されています。海外にも研究開発拠点を保有し、研究開発から社会実装まで幅広く貢献しています。

弊社が生成AIの開発に取り組む理由の1つは、われわれは、知の拡張や知識欲の発露として生成AIの研究開発を位置付けているため、もう1つは、労働/業務の効率化を通じて労働力不足という社会問題に対処するためです。

Transformerの出現によってこの領域の技術が一気に進化し、さまざまなランゲージモデルが出現する中でChatGPTが登場しました。LLM (Large Language Model)は大規模なパラメータを持つモデルと考えられ、量が質を変化させたという言い方もされています。今までAIは比較的単一のものでしたが、今後は複数のAIの連携技術で勝負する時代になるだろうとみています。

LLM開発におけるグローバルの動向に目を向けると、欧米のテックジャイアントと呼ばれる人たちを中心に、プラットフォーム化を狙った連携が複雑に進んでいます。また、スタートアップ系の台頭も非常に盛んで、業界の覇権を取るための連携が急速に進行しています。一方、国内に目を転じると、モデルの大規模化というよりは業種や業務の特化を狙った動きが見て取れます。

NECにおける生成AI開発

弊社でも高い日本語処理能力と高速性を持った独自のLLMを開発しており、LLMを活用するための周辺のソフトウェア「NEC Generative AI Framework」や、専門家集団によるワンストップのサービスも併せて提供しています。

また、弊社の生成AI基盤モデル「cotomi」をはじめ、LLMモデルを活用した業務改善のアプローチを行っています。音声認識技術とLLMを組み合わせた業務改善としては、対話の自動要約、情報の蓄積・ナレッジ化によって、コンタクトセンターのオペレーターの業務工数の削減に取り組んでいます。

その他、映像処理とLLMを組み合わせることで、事故発生時のドライブレコーダーの映像から自動的に報告書を作成することも可能です。病院業務においては、医者と患者の対話からカルテを自動生成できるので、業務負荷の軽減に貢献できると考えています。また、セキュリティーに特化したLLMを活用して、脆弱性の診断や攻撃ルートの分析を行う研究開発および事業化にも取り組んでいるところです。

弊社のLLM開発は、大きく3つのプロセスを取っています。まず、事前学習で大量のデータを学習させ、LLMのモデルに知識と推論能力を持たせます。そのモデルの規模でデータ量が大体決まってくるため、どんな大きさのモデルにどれだけのデータを学習させるかが腕の見せどころになります。

使えるGPUの計算資源は有限ですので、そこから最適なデータ量やモデル規模を定めていきます。最近のトレンドは、モデルサイズを抑えつつ、大量のデータを投入する傾向が見て取れます。データは有限なので、いかに高品質なデータを多く集めて学習させられるかが競争力につながります。

次に、モデルに機能を持たせる工程が事後学習です。事後学習は指示学習とアラインメントの工程に分かれています。欲しい機能を定義して、そのためのデータを作って学習させるのですが、その設計をいかにきれいに、丁寧に行うかがポイントになります。

指示学習で機能を定義し、アラインメントの工程で入力に対する出力を学習させ、最後にモデルの評価・選定を行います。方法論が必ずしもまだ確立されていない部分もあるため、複数の尺度で評価を行い、総合的に良いモデルを選定します。

日本の企業が生成AIを研究開発する3つの意義

われわれは、日本企業による生成AIの研究開発には3つの意義があると考えています。1つ目は、国産であることです。日本の言語、文化、常識、コモンセンスに根差したモデルの開発および維持は、経済安全保障の面からも非常に重要なポイントであると考えています。北米の先端技術あるいは欧州の先進規制の状況も鑑みながら進めていくことが重要です。

2つ目は、自前であることです。ツールを使いこなすためには、そのツールを作れるほどの知識や能力が求められます。そこに関してはAIやLLMも同様です。非常に動きが速い業界だからこそ、作って終わりではなく、使い続けていく必要があります。

3つ目は、強みを持つことです。弊社の場合は高速性と日本語性能を挙げていますが、ユニークに訴求できる強みを磨いていかなければ、激しい競争の中で埋もれてしまいます。

LLM開発が抱える課題

社内外で利用者や関係者と会話する中で、課題はまだ多いと感じています。精度・性能面、安全性、コスト面の3つに大きく分類できると思います。

精度・性能面では、特にクラウド型の動作が遅いこと、思った結果が得られないという意味で受容性や正当性の欠如、また、非テキストデータの利活用があります。安全性においては、著作権、プライバシー、機密情報の漏えいに対する対策が挙げられます。コスト面では、利用料や消費電力に加えて、高い開発費が課題となっています。

われわれとしては対策を打ち続けるしかないのですが、精度・性能の課題に対しては、ファクトチェック機能の導入、ハルシネーションの抑止、マルチモーダル対応を行い、コスト面の課題に対しては、小型軽量版の導入やオンプレミス対応を検討しており、これは機密情報の扱いにも効いてくると考えています。

性能を上げるためには業種やタスクに特化する、あるいは日本向けの対応がポイントになってきますが、学習データの透明性をキープしつつ、海外との競争という観点からも投資規模に頼らない強みを確立していく必要があります。

今後の展望

生成AIの開発は必要とされる技術が非常に幅広く、競争状況はさらに激化していくと見ています。そうした中で、短期的な展望としては、マルチモーダル技術の進化、結果の正当性の評価あるいは受容性の向上、高速性や業界特化のさらなる強化に取り組んでいきたいと考えています。

中長期の展望としては、労働力が減少していく社会でも生活水準を維持・向上させていくための技術開発が必要となるので、業務の効率化と併せてAIの民主化を進めて、誰でも簡単に使えるAI、あるいは人間の知的能力の拡張を目指していきたいと思っています。

われわれは、協調領域と競争領域は分けて考えるべきだと思っています。日本固有を含む学習や評価のためのデータの整備、用力費も含めた学習・推論のための計算資源、正しい進化を促す評価の仕組み、そしてポスト生成AIに向けた方向性について、引き続き議論していきたいと考えています。

コメント

渡辺:
生成AIやLLMが生まれた背景は、大きく2つあると考えています。1つは、2000年前後に始まったインターネット革命によって、インターネット上に大量の情報が蓄積されたこと。そしてもう1つが、高速かつ省電力で情報処理をする半導体が進化したことです。

このデジタル分野に生成AIという革命が生まれているわけですが、インターネット上には存在しないデータがまだたくさんあります。新しい世界的なプレーヤーが出てくる中、市場ニーズを捉えつつ、現場データを有効活用しながら価値を創出できれば、競争力の確保にもつながります。

昨今、基盤モデルが生成AIによって非常に注目されていますが、利活用につなげていくためにはまだ少し距離があると考えています。人間の社会は極めて多様なモーダルのデータによって情報交換や分析がされているため、さまざまな技術の組み合わせが必要であり、利活用と一体となった開発力を日本としても身に付けていくことが求められます。

経済産業省は、GENIAC (Generative AI Accelerator Challenge)として、LLM開発のキャッチアップおよび基礎体力づくりを主眼に置いて、日本の生成AIの開発力の強化に向けて取り組んでいます。AIを作る人材育成に加えて、デジタル技術を使う側の幅広い人材育成とその活躍の場も不可欠であると考えています。

AIの開発者は利用者向けにオーダーメードのAIを提供することで貢献し、利用者はデータを提供することで貢献します。利活用によって得られたデータを基にAIの性能を向上させるといった循環が不可欠で、業界・業種・業務においてユーザー横断的なAIをデファクトとして提供していくことが重要です。

その際には、協調領域と競争領域を分けた上で複数のユーザーと複数の開発者による共創的な取り組みが欠かせません。Amazonのフライホイール効果のように、サービス提供者と利用者間の循環によってデータを蓄積していき、性能を高め、エコシステムを拡大していく取り組みを期待しています。

質疑応答

Q:

高齢化に対応したAIの開発は可能でしょうか。

花沢:

基本的には可能だと考えています。高齢化に対応したアクティビティーが今あるわけではありませんが、老若男女を問わず、誰でも使えるAIを念頭に置いて技術開発を進めています。

Q:

汎用の世界において国産AIに勝ち目はありますか。業種に特化する場合は、自動車や医療といった領域になるのでしょうか。製造業でのAI活用の見通しについてお聞かせください。

花沢:

どこで勝つかという話はいろいろな尺度があります。非常に厳しい戦いになるとは思いますが、私自身はまったく諦めているわけではありません。特化する領域としては、自動車や医療はもちろん、ヘルスケア、保険業、金融業、製造業等、さまざまな産業領域や事業ドメインがあります。そういった中で、コパイロットと呼ばれる領域は業種共通で使えますし、業種や業務にフォーカスした生成AIの活用を弊社としてもやらせていただいています。

Q:

画像認識や顔認証技術を生成AIの開発にどのように生かされていますか。日本語のデータと英語のデータではその量が異なりますか。また、日本語のデータを扱う場合、技術開発上の難点は大きいのでしょうか。

花沢:

映像認識のAIと生成AIやLLMを組み合わせる、あるいは画像系と映像系を組み合わせた活動も弊社は積極的に行っています。ご指摘の通り、日本語のデータと英語のデータでは存在しているデータ量が桁違いです。ただ、どのデータをどのように入れるかがポイントで、必ずしも世の中に存在しているデータ量の違いがLLMの性能の違いに直結しているわけではないと考えています。

Q:

企業の機密情報は生成AIにインプットされていますか。また、機密情報の扱いに関するガイドラインはありますか。

花沢:

社内のガイドラインでは弊社の企業情報をある一定のラインまで生成AIに使えるように設定しています。弊社が生成AIをお客様に提供する場合は、弊社所有の閉域のクラウド環境、あるいはオンプレミスでお客様の環境で組ませていただくというアプローチを取っています。

Q:

ポスト生成AI、そしてAGI(Artificial General Intelligence)に関する汎用的なAIの発展をどのように想定されていますか。これからのAIの姿について、政府に対する期待も併せてコメントいただけますでしょうか。

花沢:

AIをいろいろ組み合わせながら、開発者とユーザー、そして横のつながりの協力によって世界をつくっていく形が1つの方向性だと考えています。AIを共有・融通していくために、政府の皆様と一緒にインターフェースや安全性の検証・保証について議論させていただければと考えています。

渡辺:

高価な計算資源や今後重要になるデータの収集、共創的な取り組みのコーディネートをはじめ、AIシステムの性能評価においても、NECのような企業が羽ばたけるように国としてもサポートしていきたいと考えています。

この議事録はRIETI編集部の責任でまとめたものです。