ノンテクニカルサマリー

人工知能で、人のこころは癒せるか?:人工知能(自然言語処理)フィードバック機能搭載型のインターネット認知行動療法(iCBT-AI)の抑うつ者に対する世界初の効果検証(無作為統制試験)

執筆者 宗 未来 (慶應義塾大学)/関沢 洋一 (上席研究員)/竹林 由武 (福島県立医科大学)
研究プロジェクト 人的資本という観点から見たメンタルヘルスについての研究 2
ダウンロード/関連リンク

このノンテクニカルサマリーは、分析結果を踏まえつつ、政策的含意を中心に大胆に記述したもので、DP・PDPの一部分ではありません。分析内容の詳細はDP・PDP本文をお読みください。また、ここに述べられている見解は執筆者個人の責任で発表するものであり、所属する組織および(独)経済産業研究所としての見解を示すものではありません。

人的資本プログラム (第四期:2016〜2019年度)
「人的資本という観点から見たメンタルヘルスについての研究 2」プロジェクト

ポイント

  • 人工知能(AI)の機能の付いたインターネット認知行動療法(iCBT-AI)がうつに対して効果があるかどうかの厳密な検証試験が世界で初めて行われた。
  • 分析の結果、iCBT-AIは、非AI型のインターネット認知行動療法に比べて、実施者が途中で脱落しにくくなり、長期的には重症うつ者の割合を減らす可能性がわかった一方で、短期的な効果は非AI型に劣ることが示された。
  • 本研究でiCBT-AIのポテンシャルが示されたので、今後の更なる技術開発、およびその検証が期待される。

1.問題意識と研究の設計

うつ病は自殺危険因子でもある重大な障害である。また、その予備軍である軽症(未病)うつまで含めると、高額な社会的コストにもつながる。

うつ病を改善するための取り組みとして、非適応的な考え方や行動習慣を修正する「認知行動療法」が注目されている。しかし、少ないセラピスト数やコスト高などにより、未だ十分な広がりはみせていない。その対応策として、諸外国ではセラピストに頼る前にインターネットを活用した自習での認知行動療法(iCBT: internet-based Cognitive Behavior Therapy)によって、まず自分で取り組むことが推奨されており、英国をはじめとした諸外国では、軽症うつ病の第一選択として公的医療制度においてもiCBTが導入されている。

しかし、iCBTによる介入では短期的には抑うつ症状は改善するものの、効果が長期的に持続しない、脱落率が高い、社会機能の改善につながらないといった課題が残されている。専門家のサポートによる支援型iCBTは効果の増強が期待される反面、依然としてコストの問題を無視できない。軽症うつを呈する人々の潜在的な数が極めて多いことを考慮すると、iCBTにおける専門家による関与を最小限にするための対応が必要である。

近年、人工知能(AI: Artificial Intelligence)技術の一領域であり、人が日常的に使っている言語をコンピュータに理解させる「自然言語処理技術(NLP: natural language processing)」を用いた対話エンジンをiCBTに応用して、画面上に架空のセラピストが登場して、エクササイズの実施者に共感の言葉を示したり、不適切な入力に対してアドバイスを行ったりするiCBT-AIが開発されている。本研究では、AI機能以外は全く同じスペックであるiCBT-AI群と通常のiCBT群、更に待機群の3群間で、どの群が最もうつ症状の軽減効果が大きいかを無作為統制試験で検証した(図1)。主要評価指標としては、代表的なうつ評価指標であるPHQ-9を用いた。

図1:研究の流れ
図1:研究の流れ

2.結果

脱落についてはiCBT-AI群が、iCBT群に比べて有意に低かった(図2)。

うつ症状については、通常のiCBT群では、待機群と比べて、介入期間終了直後に改善する有意傾向が認められ(p=0.05)、3カ月後のフォローアップでは有意に改善したが、iCBT-AI群では有意な改善は認められなかった。一方で、大うつ病性障害水準の重症うつ状態(PHQ-9得点が10点以上)の基準を満たす者の割合は、介入期間終了直後においては通常のiCBT群、iCBT-AI群ともに待機群に対して有意差は認められなかったが、3カ月後のフォローアップでは、iCBT-AI群のみにおいて減少する(重症うつの人々が少なくなる)傾向が認められた(オッズ比0.67; p=0.08)。

図2:エクササイズ(コラム法)の利用状況
図2:エクササイズ(コラム法)の利用状況

本研究の募集時の参加資格は、最低でも軽症うつ水準(PHQ-9得点で5点以上)を満たすことであったが、開始時までに自然軽快してしまい、うつでない人々(5点未満の人々)も効果検証に含まれ、バイアスとなっていた。また、対象が臨床患者群ではない本研究では、特に軽症うつ者にどのような効果が得られるのかという点が大きな焦点であった。そこで、開始時における主要アウトカムのPHQ-9が、非うつ者(5点未満)、軽症うつ者(5点以上10点未満)、重症うつ者(10点以上)をうつの重症度別に下位集団分析を行った。

分析の結果、開始時に軽症うつ者だった集団において、3カ月後フォローアップ時に、iCBT-AI群の重症うつ者の割合が待機群に対して約1/3 [オッズ比が0.35(95%信頼区間:0.14 to 0.86, p=0.02)]と有意に低くなった(表1)。このことから、軽症うつ者のうつが重症化することを長期的に防ぐ効果が、ICBT-AIだけに存在する可能性が示された。

表1:ロジスティック回帰分析の結果(うつのPHQ-9得点による重症度別)
開始時の得点 オッズ比(95%信頼区間);p値
iCBT群 vs iCBT-AI群 iCBT群 vs 待機群 iCBT-AI群 vs 待機群
5点未満 介入終了時 0.77(0.11 to 5.45);0.79 3.27(0.27 to 39.37);0.35 6.09(0.53 to 70.59);0.15
3ヶ月フォローアップ時 0.97(0.13 to 7.45);0.98 1.29(0.17 to 9.89);0.81 1.15(0.13 to 10.26);0.90
5点以上
10点未満
介入終了時 0.67(0.29 to 1.54);0.35 1.06(0.47 to 2.39);0.89 1.37(0.66 to 2.84);0.40
3ヶ月フォローアップ時 1.89(0.73 to 4.93);0.19 0.79(0.36 to 1.75);0.57 0.35(0.14 to 0.86);0.02
10点以上 介入終了時 0.81(0.42 to 1.57);0.54 0.59(0.31 to 1.10);0.09 0.71(0.37 to 1.35);0.29
3ヶ月フォローアップ時 1.10(0.60 to 2.01);0.77 0.86(0.49 to 1.53);0.61 0.81(0.46 to 1.43);0.46
(注1)性別、年齢、ベースラインのPHQ-9、GDA-7の数値を調整している。各時点毎に算出。
(注2)赤字は5%水準で有意なもの。

結論として、iCBT-AIは、非AI型のiCBTに比べて脱落を有意に減らすこと、短期的な効果は非AI型に劣ること、長期的には非AI型には認められない将来の重症抑うつ者を減らす可能性があることが示唆された。また、iCBT-AIの脱落率が非AI型よりも低かったことを考慮すると、iCBT-AIではiCBTに比べてより多くの抑うつ者が行えるエクササイズとなる可能性が示唆された。本研究におけるiCBT-AIとiCBTとの差は、NLPによる共感機能とアドバイス機能の2つしか存在しない。そのため脱落に差が出る原因としても、それらのいずれか、もしくは両者が影響したと推測されるが、それらは今後予定されている二次解析の結果が待たれる。

我々の知る限り、諸外国でもこのような人工知能のiCBTへの応用に関する効果検証の報告は認められていない。走り出したばかりの本技術は限界も少なくないが、当研究を足がかりとして今後の更なる技術開発、およびその検証が期待される。