DXシリーズ(経済産業省デジタル高度化推進室(DX推進室)連携企画)

未来の声を解き明かす:AI音声解析エンジンの革新と応用

開催日 2024年1月25日
スピーカー 橋本 泰一(株式会社RevComm 取締役 執行役員 / Research Director)
コメンテータ 杉之尾 大介(経済産業省商務情報政策局情報産業課 課長補佐)
モデレータ 木戸 冬子(RIETIコンサルティングフェロー / 情報・システム研究機構 特任研究員 / 東京大学 特任研究員)
ダウンロード/関連リンク
開催案内/講演概要

音楽に始まり、画像や映像、位置情報、健康データなど、さまざまな人類の情報がデジタル化され、新しい産業が生まれている。では、膨大な日々の「会話」のデジタル化はどうか。AIは膨大な音声データを経営資産に変換することができるのか。株式会社RevCommは、AIによる音声解析プラットフォーム「MiiTel(ミーテル)」を開発するなど、過去にChatGPTのOpenAI社など世界のAI先端企業が選ばれる「Forbes AI 50」に、昨年(2023年)、アジアで初めて選ばれている。今回の講演では、同社でMiiTelの開発責任者を務める橋本泰一 Research Director を講師としてお招きし、世界最先端のAI×音声技術ビジネスの現状と展望をお話しいただいた。

議事録

音声×人工知能のプラットフォーマーを目指す

株式会社RevCommは、2017年7月7日に創立し、250名程度の従業員からなるスタートアップの会社です。「コミュニケーションを再発明し、人が人を想う社会を創る」ことをミッションとして、「Happiness」「Accountability」「Professionalism」「Passion」「Youthfulness」からなる「HAPPY」をコーポレートバリューに掲げています。

日本が人口減少とともにGDPの順位を大きく落としている状況において、最も重要なのは1人あたりの生産性を上げることです。RevCommは音声に着目し、人と人とのコミュニケーションを効率化させ、1人あたりの生産性を向上させるため、音声と人工知能を掛け合わせたプラットフォームを構築する事業を展開しています。

営業担当者と顧客の間の商談、あるいは上司と部下との会話やチーム内での定期的な会議など、ビジネスをする上で人と人との間でのコミュニケーションは多く発生します。しかし、それらは参加者の中で閉じたコミュニケーションになりがちで、その内容を第三者に共有することが難しい状況です。また、時間がたつにつれて、参加者間で理解した内容の食い違いが発生するなど、「音声コミュニケーションのブラックボックス化」問題が起きています。

そこで、われわれがこの問題を解決するために提供しているのが、「MiiTel(ミーテル)」です。MiiTelはAI搭載型のIP電話サービスで、電話、オンライン会議、対面会議等で話されている内容を記録し、AI技術を使って解析することで、さまざまな観点でコミュニケーション情報を可視化するサービスを提供しています。

実際に記録された音声データを解析し、定量化することで、営業戦略やマーケティング施策やプロダクト開発における次の指針になるものを情報として見つけ出して、明らかにすることができます。

MiiTelによる業務効率化・ユーザーの成長支援

MiiTelは、累積導入社数が約2,000社、累計6万ユーザー以上にご利用いただき、われわれのプラットフォームには2億回の通話データが保存されています。

MiiTelの主要機能の1つは、電話の内容を解析し、定量化することです。話す速度、会話の被せ率、ラリー回数を数値化し、グラフとして見ることができます。こういった情報を得ることで、コミュニケーションの実態を明らかにすることができます。

2つ目として、全通話を録音し、文字起こしをしているので、会話の内容や流れを俯瞰して見ることができます。そして3つ目はCRM(顧客管理)連携で、営業活動を記録として残し顧客リストを一元管理できるため、業務の効率化に役立ちます。

会話内容のテキスト化に加えて、ChatGPTを使った要約機能も備えているので、議論の重要なポイントや今後取るべきアクションなども簡潔に整理されます。また、さまざまな統計的数値をダッシュボードで一覧することができるので、マネージャーがメンバーの営業活動状況を把握するのも容易です。

通話データを記録・分析し、分析結果を受けてアクションを取り、改善していくという、PDCAのサイクルを音声コミュニケーションにおいても実現することができるというのが大きな特徴です。

それがアポイントメント率や成約率の上昇、そして企業の売り上げ向上につながるとともに、顧客満足度や営業担当者のコミュニケーションの質も高まります。また、自分自身で改善すべきポイントを確認できるので、マネージャーによる教育コストや、今まで人間が時間をかけてやっていたアフターコール業務を削減することもできます。

目に見えないコミュニケーションの可視化に注力

電話以外にも、われわれは、「MiiTel Meetings」というオンラインに特化したサービスも提供していますし、2023年7月には、「MiiTel RecPod」という対面で録音するサービスもα版としてリリースしました。そして、これらのサービスをさらに拡張して、「MiiTel Call Center」というコールセンター業務に特化したサービスも提供し始めています。

RevComm社はMiiTelのリリースをきっかけに大きく成長し、さまざまな領域で多様な業種の企業に導入いただいており、現在は、インドネシアでの海外展開も進んでいます。2023年4月には、世界で注目されるAI企業50社のうちの1社として、「Forbes AI 50 2023」に選出いただき、また、経済産業省が推進するJ-Startupプログラムにおいては、J-Startup企業としても認定いただきました。

昨年(2023年)には、RevComm Researchという、主にR&Dを中心とした組織を新設し、ビジネスでの大規模言語モデル活用のメリットを見据えて、現在、筑波大学、京都大学、九州工業大学との共同研究も継続して行っています。

データを価値へ変換するAI技術の応用

われわれは音声認識以外にも、音声感情認識、話者分類・話者識別、留守番判定の技術も開発しており、対話要約、トピック判定、クレジットカード番号のマスキング技術、音声合成や音声から顔画像を生成する技術にも取り組んでいます。

昨年(2023年)、われわれのシステムと他社音声認識製品の性能の検証を行いました。RevComm、Amazon AWS、Google Speech to Text、アドバンスト・メディア、OpenAI、Microsoftで、15の異なる企業体のデータとオープンに公開されている2つのデータに対する評価を行いました。

その結果、ビジネスにおける音声解析ではRevCommの認識率が良く、性能が高いことが分かった一方で、一般的な音声データに関しては、各社の性能にあまり差がないことが示されました。

RevCommのシステムは、一言一句正確に音声認識できることに加えて、ビジネス用語に強いという、2つの大きな特徴があります。フィラー(「ええと」、「あのー」など、会話の間に挟まれる意味のない言葉)も正しく認識するので、実際の会話との乖離が少ないのがポイントです。また、ビジネスに特化した会話データを学習させているので、一般的なビジネス用語において高い音声認識を実現しています。

われわれはAI技術を用いて、企業が持つさまざまな情報資産をデータとして蓄え、改善に向けた気付きや課題解決のために活用していただけるように推進しています。これまでは解析に力を入れてAIの技術を磨いてきましたが、今後は蓄えられたデータを運用するためにAIの活用を検討しており、今後1年の間に実現したいこととして、次の4つを掲げています。

1つ目は、議事録の作成です。認識の齟齬による非効率なコミュニケーションを改善するため、AI技術を活用した効率的な議事録作成を考えています。

2つ目は、資料や原稿の作成です。資料作成がうまい人の技術をAIが学ぶことで、コミュニケーションの均一化にも貢献できると思っています。

3つ目は、評価・分析です。見える化されたグラフや数値を見ても問題に気付くのはなかなか難しいので、生成AIが分析をし、示唆出しができる技術を確立しようと考えています。

4つ目は、教育やコーチングです。AIと話をすることで自身のコミュニケーションの仕方を改善していくという、トレーニング相手としてのエージェントを実現していきたいと思っています。

AIを軸にした新たなビジネスの創出に向けて

McKinsey & Companyは2023年、今後、生成AIが年間最大約4.4兆ドル(約616兆円)の経済効果を世界的にもたらすと発表しました。われわれは、生成AIへの投資あるいは新規ビジネス創出への投資が、日本経済を活性化させる上で大きなポイントになってくると考えています。

新たな領域を開拓するビジネスを早期創出・支援できれば、グローバルに大きくなる日本発の企業を生み出していけるのではないかと思います。その上で、国への要望を4点挙げています。

1点目は、AIビジネスのガイダンス作成です。この分野は未知の領域で、整理されていない部分もあるので、一定の法や規制をかけていく必要があります。早めにガイダンスを作成いただき、指針を提示していただけるとありがたいと思っています。

2点目は、安心安全なAI企業へのライセンス発行です。AIを使った新サービスの導入に当たっては不安視される企業も多いので、お墨付き企業のようなライセンスを発行していただけると、検討している企業にとっても非常に導入しやすくなると考えています。

3点目は、海外へのデータ流出の強い規制です。海外企業が日本に進出してくる際に、企業の資金力の差や日本の規制が緩いことで、国内の企業が負けてしまうケースがあります。そのため、海外からのデータ閲覧やデータの活用に関しても規制をかけていかない限り、対抗するのは難しいのではないかと思います。

4点目は、高度AI人材の人件費の問題です。AI人材の不足、人件費の高騰、海外企業と国内企業の間での人材の取り合いが生じる中、政府による国内企業への支援がポイントになります。例えば、スタートアップ企業に対して、AI技術に造詣が深い人材を対象に1人あたりの人件費のフォローアップをする、あるいは税理的な優遇を利かせるような制度があると、非常にありがたいと思います。

コメント

杉之尾:
私は生成AIの開発力強化を担当しており、基盤モデルの開発の支援や、AIの開発に不可欠な計算資源の整備に向けた取り組みを進めています。その上で、AIの開発だけでなく、その利活用が重要だと考えています。

AI技術による生産性の向上や付加価値の高いサービスの創出が将来的には行われていくと考えられる中で、日本にAIの基礎的な開発力がないとビジネスチャンスを逃してしまい、ひいては経済安全保障上の課題にもつながるといった認識から、ビジネスの創出は重要ですし、AIの利活用と開発を好循環させていくことが非常に重要だと思っています。

AI開発において重要なのはデータです。データは比較的に利活用者側にあり、開発者側には比較的に人材はいるがデータは無いという状況であることから、開発者側が人材を供給し、利活用者側がデータと資金を提供するような好循環を作るための、マッチングの場の提供を検討しています。

RevComm社のように、ビジネス上の悩みを技術で解決し、それを事業として起こし、ユーザーにそのサービスを使ってもらう取り組みをいかに創出するかが重要だと思っています。われわれとしても、AIを活用して新たなビジネスや市場を生み出すことで、AIの利活用と開発を好循環させていくことは重要だと考えており、好循環の実現に向けて、今後も知恵を絞っていきたいと思います。

橋本:
非常に勇気をもらえるコメントをいただきました。施策として落としていく際に一緒に考えていくことができればありがたいですし、若い人ががんばっている小さな会社の意見も聞いていただきつつ、AIを中心として、今後グローバルに羽ばたいていくような企業がいくつも出てくるような世界が作れるとうれしいなと思っています。

質疑応答

Q:

日本の高齢者に向けた性能の良いAIを開発するには、必要な予算や期間はどのくらいでしょうか。

A:

金額をお答えするのは難しいのですが、時間に関していうと、エンジンだけの開発でしたら1年あれば十分できると思います。ただ、高齢者に使っていただくためのデバイスも含めたソリューションを全体で考えると、数年という時間が必要になると思います。

Q:

音声感情認識機能でパワハラ度などは判定できるのでしょうか。

A:

恐喝や脅しは音声の質や話し方が大きく違います。われわれのAIの機能では、怒りや悲しみに近しい話し方といった音声の特徴をとらえてネガティブな判定が出ると思うので、実現可能だと思います。

Q:

政治離れを食い止めるために、議員がどれだけ真面目に議論しているか等もつかめるものなのでしょうか。

A:

実際に音声で聞いただけでは議論の内容や返答を正確には記憶にとどめきれませんが、それを録音、テキスト化することによって、中身のある議論であったのかどうかを見える化することはできると思います。

Q:

電話営業自体が衰退産業であり、大規模言語モデルの開発は海外に追いつかないのではないでしょうか。

A:

海外においても電話営業はそれほど衰退しておらず、インサイドセールスの領域ではまだ十分活用されています。時間がかかる業務が多い領域なので、少ない人数で効率的にできる、われわれのサービスを導入していく企業が今後伸びていくだろうと考えています。

Q:

音声から顔画像を生成する技術はどのようなメリットがあるのでしょうか。この技術を犯罪捜査や要注意人物のプロファイリング作成にも活用できるのでしょうか。

A:

音声から顔画像を生成する技術は基礎技術として取り組んでいる状況で、実際のビジネス応用に関してはこれからの課題です。この技術は、あくまで音声から読み取って想像できるような人物ということなので、犯罪者等を特定するための技術としてはまだまだ課題があると思います。

Q:

RevCommの顧客に公共部門はありますか。また、民間技術の活用とは違う課題はあるでしょうか。

A:

東京都の保健所で、コロナの電話対応にわれわれのサービスを一部導入していただいた実績があります。サービスとしては、民間企業へも公共機関へも同一のレベルを、高いセキュリティーを持って提供させていただいています。

Q:

海外展開についてはどのようにお考えでしょうか。

A:

現在は、インドネシアと米国に対して海外展開をしており、今後、広げていければと思っています。

Q:

海外にデータを流出させないための技術として、どのようなものをお持ちでしょうか。

A:

特にこれといった技術はありません。企業が海外展開していく上でデータの活用が必要になるので、規制が緩くなると、海外の事業者が日本のマーケットに進出してくる可能性はあります。そういったところのバランスで、技術の問題というよりは法規制の問題だと思います。

Q:

言語モデルのチューニングは検討されていますか。

A:

現在、領域に応じたチューニングは対応していません。今後、弊社のサービスを使用する場面において、適切なモデルの最適化の必要性があるものに関しては対応していきたいです。

この議事録はRIETI編集部の責任でまとめたものです。