医療の世界が大きく変革——AIは医師の補佐役になれるか

医療におけるAIのブームはこれまでに幾度か起きている。現在は、ブレイクスルーともいわれる、AIを用いた深層学習による画像認識が多くの病院で利用され始めた。さらに進化すれば、人間が見落としがちな病変や、診断が難しい病気に大きな効力を発揮する可能性があり、医師の確かな補佐役になると期待される。一方、学習内容に依存するため、学習データの偏りが結果に反映されるリスクがある。こうした課題を克服していければ、まったく異なるスタイルの医療が実現するかもしれない。

人工知能（AI）の概念は、1950年代、コンピュータサイエンスの父とも呼ばれるアラン・チューリングによって提唱された「チューリングテスト」が起源とされています。AIにはすでに70年以上の歴史があり、これまでに何度かブームが起きています。

IF-THEN-ELSEルールの限界

1960年代、第1次ブームのときに「ルールベース・エキスパートシステム」が開発されました。このシステムはIF-THEN-ELSEというルールで専門家の知識が記述されます（図1）。「IF（もし～ならば）」で与えられた条件を評価し、条件に合致したら「THEN（そうであれば）」以下の処理が実行され、条件に合致しなければ「ELSE（そうでなければ）」以下の処理を実行するという仕組みです。医療分野のシステムでは「もしこのような症状があれば」「こういう疾患が推測される」、「このような検査結果であれば」「こういう治療を検討する」、「こういう症状が同時に出現しているのであれば」「次にこういう質問をする」といったように、医師の専門知識をIF-THEN-ELSEルールに基づいて大量に記述します。そのシステムに患者の性別、年齢、症状、検査結果などの情報を入力すると、さまざまな条件式と照合して、合致すれば、THENのアクションを提示するものです。

図1 IF-THEN-ELSEルールの例内科の領域の場合、特定の症状や検査結果に基づいて、治療方針や検査を提示する。例えば、発熱があり、もし38℃以上なら（IF）、次に急激に発症したかどうか（THEN IF）、そうでなければ経過観察とする（ELSE）のように、条件と結果、それ以外を逐一書き示す。

1970年中盤、アメリカでは、この技術を用いて敗血症患者に処方する抗生剤選択の支援システムや多様な症状と疾患の関係を膨大なルールに落とし込み、患者の病気を推論する「INTERNIST（内科医）」というエキスパートシステムが登場するなどして、世界を驚かせました。

そうした世界の動きを受け、1982年、当時の通商産業省が「1990年代終わりまでに『考えるコンピュータ』を作り上げる」として、巨額を投じたのが第五世代コンピュータプロジェクトです。医療の分野も大きな対象フィールドとなっており、私が大学院生だった1980年代後半ごろには、学内で緑内障の診断支援システムや汎用的な診断支援エンジン（特定の処理を行うための機能をまとめた装置やシステム）の開発が行われていました。

ところが、1990年前半ごろになるとAIの開発は行き詰まりを見せるようになります。先述したように、ルールベース・エキスパートシステムは、知識として記述されていないことはできません。緑内障の診断システムであれば数千というルールを記載し、その結果、緑内障だ、あるいは緑内障ではない、という診断結果が得られます。緑内障ではないという結果が出たら、何の病気かを診断するまでに、専門システムを繰り返し使って、病気を探っていくことになります。

しかし医師であれば、1人で、白内障か緑内障か、何か他の病気かを診断し、疾病に応じて治療に進みます。結局、ルールをいくら記述しても不足があり、ルールベースシステムを基にしたAIの限界が見えてしまったのです。

ディープラーニングを用いた画像認識

前後して、1980年代には「機械学習」という技術が、すでに登場していました。コンピュータにデータからパターンを学習させる技術で、現在使われるAIにつながるものではあるのですが、この技術を利用するには大量のデータを処理する必要があり、当時のコンピュータの処理能力やデータ量の制限もあって、この時代は「AIの冬」と呼ばれる停滞期となりました。

しかし1990年代半ばから2000年代初頭にインターネットが普及してビッグデータが蓄積されていくとともに、コンピュータの性能も格段に向上したことで、AIは再び急速に発展し第3次ブームを迎えます。特に、2012年にトロント大学のジェフリー・ヒントン教授らによって発表された機械学習の一つ、「深層学習（ディープラーニング）」を用いた画像認識は、AIのブレイクスルーとして知られています。

深層学習は、「人工ニューラルネットワーク」という仕組みを用います（図2）。これは、ヒトの神経回路を模しており、多層の「ニューロン」で構成されています。入力されたデータは、ニューロンの各層を通過するごとに処理され、コンピュータの中に一種のモデルを作り上げていきます。例えば多くのネコの画像を入力すると、「ネコというもの」のパターンをシステムが徐々に学習し、その概念を自身で獲得していくのです。ディープラーニングは特に画像の分類に長けていますので、従来、画像データを多く使って膨大な蓄積がある医療の分野、特に放射線画像で病変の場所を見極めるソフトウェアが次々と作られました。

図2 人工ニューラルネットワークの概念１ヒトのニューラルネットワークでは、頻繁に使われる神経回路（シナプス）は強化され、使用頻度の低い回路は弱化することで、学習や記憶が形成される（左）。人工ニューラルネットワークは、ノード（神経細胞）間の接続の強さを数値で表現。「1」は強い接続、「0」は弱い接続を示し、使用頻度に応じて接続の重みが変化する。２この概念を軸に、データを受け取る層（入力層）、複雑な特徴抽出や変換処理を行う層（隠れ層）、最終結果を生成する層（出力層）など複数の層でネットワークを構成。各ノード間に、情報の重要度に応じて数値を設定し、学習と予測を実現するのが機械学習の中核技術。

現在、それらのソフトウェアを組み込んで、胃の内視鏡検査でリアルタイムに異常が疑われる部位が示されたり、X線検査やCT検査での撮影画像に要注意箇所がマークされたりする医療機器がいくつも薬事承認され、大きな病院では普及が進んでいます。画像診断は、医療においてAI利用が最も進んでいる分野です。

がんの治療にもAIが利用され始めました。がんは遺伝子が変異して起きる病気ですが、遺伝子の変異はあちこちに複数見られます。その中でがんの発生に直接的な役割を果たすドライバー遺伝子を見つけるには、これまで多くの作業が必要でした。これが今、AIを使って簡易に見つかるようになってきました。血液検査の結果から専門医でも気づきにくい病気をリストアップするといったソフトウェアも試作されています。

他にも2024年のノーベル化学賞は、病気の原因となるタンパク質の立体構造をAIで高精度に推測するシステムを考案した3人の研究者が受賞しました。その構造をターゲットにした新薬の候補物質を探すといった試みが、現在行われているようです。

総合診療医のような使い方

これまでの医療は、疾患の分野や専門領域に深く特化した検査システムがあり、そこで得られるデータを基に複雑な診断を行ってきました。それらのデータを学習した高精度なAIのシステムは、その領域に関連する人には非常に有用なツールです。多くの製品が実用化され、あるいは、今後の実用化を視野に入れた開発が進められています。

2010年代後半には、現在のChatGPTにつながる、人間が話す言葉（自然言語）を処理する技術も開発され、AIは、今や、テキスト、画像、音声など、複数の異なる種類の情報を同時に処理し、複雑な推論能力を持つ「マルチモーダルモデル」へと進化しています。

すると、医療におけるAIの利用も変化していきます。今後の方向性として考えられるのは、膨大な医学テキストを学習し、一通りの症状の流れやさまざまな検査結果の異常などを入力すると、想定される病名が提示されるといった総合診療医のような使い方です。画像や検査結果の数値データ、場合によっては患者の音声データや医師が入力したテキストなどを総合的に判断して、学習したデータからAIが回答を提示するシステムが開発されつつあります。課題は、「ハルシネーション（幻想）」といって、学習していないことを上手に取り繕って文章にしてしまうといった現象です。存在しないデータに基づく結果が出力される事態は医療において致命的ですから、実用化にはまだ時間がかかります。しかし、マルチモーダルの世界は、確実に進化していきます。そして医療におけるAIは、専門家が高度な診療のために使うだけでなく、広く患者と医師、双方が使うものになっていくと考えています。

現在でも、スマートウォッチなどにデータを集約して、異常があれば「不整脈があります」と知らせるなど、小規模のAIが組み込まれたデバイスを多くの人が使っていると思います。体の不調をツールに入力して、どのような原因、病気が考えられるか、すぐに病院にかかったほうがいいのか、何科に行くべきなのかなどをAIに聞いた経験がある人も少なくないはずです。

こうした、患者側の利用はさらに広がり、ChatGPTのようなAIを使って事前に問診票を用意していくとか、診察室で聞いた医師の説明を改めてかみ砕いて説明してもらう、セカンドオピニオンを求めるなど、AIを積極的に利用する場面は広がっていくでしょう。

現在の医療では、提示された複数の治療方針から患者自身が選択するという場面がありますが、専門家でない患者にとっては難しいことです。そのような場面で、薬の説明や服用方法、治療成績を自分なりに調べる、あるいは医療費を概算するといった、自分の受ける治療に関する情報の収集など、さまざまな使い方があると考えています。

医師にとっても、AIが有効なツールとして役立つ場面は多いと思います。先述の画像診断の支援に加えて、患者のさまざまなデータや症状から、見落とさないように注意すべき疾病のアドバイスを受けるなどという例もあるでしょう。医師は、自分の専門分野以外でも治療をしないといけない場面があるのですが、その際、治療方針の選択肢や成績の比較など、膨大な論文や専門情報を集め、要約するという作業にAIを使っている医師も増えています。あくまでも参考情報を手に入れる手段として利用していますが、自分で行うよりもはるかに作業効率が上がります。

データの偏りが結果に反映するリスク

こうしてAIが使われるようになって最も変化するのは情報の在り方です。これまでは患者と医師が情報を共有するという概念が薄かったように思いますが、ChatGPTのような仕組みを双方が使うようになると、患者側も独自にどんどん情報を入手することができます。そのとき「この先生はAIが言っていたことを言わない」などと疑われてしまうような世界は好ましくありません。むしろAIによる情報提供を前提としたうえで、互いが共有する情報についてコミュニケーションを取りながら医療への理解を促進することが重要になるのです。

ここまで医療とAIについて述べましたが、実は今、この分野でAIに最も期待されているのは、事務処理の負担を軽減することです。

医師は、高度な専門知識を持って医療に当たるのが役目ですが、実際には業務時間の半分以上を書類作成に充てています。各種のサマリー（患者の病歴、検査結果、治療経過、退院後のフォローアップ計画などをまとめた退院サマリーや診療情報提供書、看護サマリーなど）、紹介状や診断書などを作成するといった作業には膨大な時間がかかります。電子カルテの入力や処方箋のミス、薬の飲み合わせをチェックするなど、医療の周辺での支援には、大きな需要があり、研究が進められています。

分野にかかわらずAI導入における共通の課題として、結果に対する責任の所在や著作権などが挙がっていますが、私が医療において特に課題と考えているのは、大量のデータを学習してモデルができあがるという現在の手法では、出力された結果が学習したデータに左右されることです。つまり、データに偏りがあれば、それはそのまま結果に反映されます。例えば白色人種に多い疾患だけを大量に学んだAIは、有色人種の疾患を当てる確率が落ちるなどということは、よく言われています。

最近指摘されているのは、内在している偏見です。非常に高齢の患者の情報を入力したときに、平均寿命を超えているとAIが判断し「平均寿命を超えているので一般的には、積極的な治療は不要です」といった、倫理感の欠如した回答を返す可能性があるのです。もちろん、システム技術研究者がそのような回答をしない設計をしなくてはなりませんが、他方、「あくまでもAIの回答」と捉える客観的な姿勢が求められます。

さらに非常に極端なデータで教育したAIシステムを作って、ある方向に治療を誘導するといったことも不可能ではありません。例えば、科学的エビデンスがある治療法に抵抗を示すイデオロギーを持った人たちが、それを妨害するようなAIをネット上で展開するなどということは、十分に起こりうることです。いずれにせよ、AIの利用には患者、医師の双方がきちんとしたリテラシーを持つことが欠かせません。

AIもモデルは1つではなく、今の技術の延長線上では、学習したデータとその後の調整によって個性が生じます。複数のAIシステムにまったく同じ患者情報を入れたら、結果もまったく同じとは限りません。今は、AI同士に議論させるような開発も行われています。将来は、複数のAIに同時に問い合わせて、AI①がAI②に、「こちらのデータからはその結果は間違っている」と指摘すると、「いや、こちらには、そちらの持っていない、こんな情報がある」と、出てきた結果をAI同士が議論し、より良い結果を導き出すといった仕組みができるかもしれません。

AIが医療にもたらす変化は、最初は見えにくいかもしれません。しかし、変化は確実に積み重なっており、気づくと、医療の世界は大きく変わっていたという日が来ると考えています。

（図版提供：大江和彦）