「見逃し」を減らせるか——AIによる画像診断システム

検査機器の精度が確実に上がってきている。大腸内視鏡検査も、超小型のデジタルカメラにより微細な病変を捉えることが可能となり、早期の発見に貢献している。しかし画像の解析・診断は医師が担うため、いわゆる「見逃し」は避けられない。その課題を解決するのがAIによる画像診断システムだ。約1万2000件の病変画像25万枚を学習させたAIはリアルタイムで自動解析する。ただ、人間が見つけられなかった病変は検知できないという課題は残る。今後の進化が期待される。

近年、AIの力を借りることで、検診の精度が上がる可能性が示唆されています。検診にあたってAIをどのように使用しているのか、何が改善されるのか。それらを説明する前に、大腸内視鏡検査でAIを使うことになった背景を理解していただきたいと思います。

24％が見逃されているという報告

通常、大腸がんは前がん病変（以下、病変）である腫瘍性ポリープ（陥凹性病変、平坦型腫瘍を含む）から発生することが明らかになっています。大腸がん検診では、超小型のデジタルカメラを搭載した内視鏡でくまなく大腸を見て、病変がないか調べます。発見した場合はすぐに内視鏡的切除術、つまりは内視鏡を使って切除治療を行います。

大腸がんの治療には早期発見が大切です。アメリカで1993年に報告されたNational Polyp Studyと2012年に報告されたそのコホート研究によりますと、病変の多くを占める腺腫性ポリープを内視鏡的に切除することで、大腸がんの罹患率を76～90％、死亡率も53％抑制したことが明らかにされています。

それだけに、内視鏡検査時において病変あるいは早期がんを見逃さないことが重要です。とはいえ実際には、24％が見逃されているという報告もあります。また別の報告では、大腸内視鏡検査を受けていたにもかかわらず、後に大腸がんに至ったケースが6％あったといいます。その原因は、内視鏡検査時における見逃しが58％を占め、来院しない（20％）、新規発生（13％）、不十分な内視鏡治療による遺残（9％）を大きく上回っています。2015年ごろには、この見逃しを減らす方法について論議が高まってきました。

大腸内視鏡検査とは、大腸の中で内視鏡を動かし、そのカメラが捉えた映像をモニターで目視して病変を発見する検査です。内視鏡を動かすのも、それが映し出す映像を見るのも、すべて人間の手作業です。そのため医師の熟練度によって見逃しが生じてしまいます。また、医師がその日一日非常に多忙で検査に時間をかけられない、疲れていて集中力が低下していたなどということもあります。大きなポリープを見つけたのでそれで良しとして、そのポリープのすぐそばにある小さなポリープを見逃してしまうこともあります。いずれも本来あってはいけないことですが、人間のやることですから、いろいろな因子が重なって起きてしまうことは否めません。そこで機械の力を借りようという動きが出てきたのです。例えば自動車の自動ブレーキ装置のように、人間が見逃してしまった病変を機械が検知してアラームで知らせることはできないか。あるいは特殊光を当てると病変が光り、見つけやすくならないか、などなど。いろいろな可能性について考えていました。

ネコの画像を見分けるAIがヒントに

ちょうどその頃、ディープラーニング（深層学習）に支えられたAIがブレイクスルーを果たして、大きく注目を集めるようになってきました。2012年に、「AIがネコの写っている画像を見分けられるようになった」という研究成果が発表されたからです。無作為に取り出された1000万枚の画像をAIに学習させたところ、AIは画像内の特徴を認識して、自発的にネコの画像を分類できるようになったというのです。そこで、大腸内の病変を分類できるようにAIに学習させ、大腸内視鏡検査をサポートさせられないかと考えたわけです。

私たちは長い時間と労力をかけて、AIに病変について学習をさせました。典型例から非典型例まで、まんべんなく画像を見せたのです。学習する画像は多いほうがよいのは間違いありません。でも、あるポリープの動画を1秒当たり30フレームの画像にして、10秒間で300枚の画像を作って勉強させても、効果はどうでしょうか。そのやり方では、似たようなポリープの発見には力を発揮しても、そうではないポリープについての認識は弱いでしょう。同一の動画の切り抜きはやめて、これまで蓄積していた静止画像を用いて多くの病変について学ばせようと決めました。

一般にAIに新規モデルを学習させるためには、1000枚くらいの画像があればいいといわれています。それだけあれば、例えばイヌならイヌをきちんと判定できるようになる。そのような世界だそうです。しかし医療に関わるものですし、典型例から非典型例までいろいろとありますから、そんな画像数では足りないだろう。ロバスト性（予期せぬ変化が起きても安定した性能を維持する力）を担保するには、最低でも1万例は学習させる必要がある。そのように考えました。

結局私たちは、約1万2000病変のオリジナル静止画像25万枚を収集しました。それらの画像一枚一枚に国立がん研究センター中央病院の内視鏡科スタッフが所見をつけ、1年数カ月の時間をかけてAIに学習をさせたのです。これは国立がん研究センターでの約5年間の病変画像で、患者数は8000人くらいになります。これだけの数の静止画像を学習させることができたのは、国立がん研究センターならではと言っていいと思います。他では、典型例はともかく、非典型例の画像は少ないでしょう。また海外の研究機関や病院は、日本ほどきめ細かく丁寧に病変を写真で撮影することは多くないと聞きます。なぜきめ細かく丁寧な画像が大事かというと、例えば病変の上に泡がのっている写真があるとしましょう。それを病変だと学習させると、AIは泡に反応したり、泡がのっていない病変には反応しないといった状況が生まれてしまうのです。病変がきれいに撮れた画像がたくさん保管されていてよかったと感じています。

こうして、国立がん研究センターが共同開発に携わった内視鏡AI診断支援医療機器ソフトウェア「WISE VISION」が完成。2020年11月に日本で医療機器として承認されました。

検査時には、モニターが2台用意されます。片方のモニターには従来通り、内視鏡カメラが撮影した動画が映し出されます。もう1台はWISE VISIONのモニターで、同じ動画を見たAIが解析し、リアルタイムで自動検出します。病変があった場合、モニター上のその部位に円マークが付けられ、通知音が鳴る仕組みです（図1〜3）。検出された情報をリアルタイムで医師にフィードバックすることで、医師とAIが一体となって検診をするのです。

図1 医師をサポートする内視鏡画像解析内視鏡医が超小型デジタルカメラを搭載した内視鏡を操作し、病変の有無を探す。その映像は内視鏡画像解析AIにも送られ、AIが病変だと解析すると、リアルタイムで内視鏡医に知らせる。内視鏡医がその箇所をさらに注意深く観察することで、見逃しを回避できるようになる。

図2 AIの画像診断システムを用いた実際の診療の様子左側のモニターには、従来通り内視鏡カメラが撮影した動画が映る。それを右側のモニターでAIが解析し、病変があれば知らせてくれる。

図3 AIが画像解析した診断結果内視鏡カメラが捉えた映像をリアルタイムでキャプチャーし、画像を生成する。AIが病変と解析した箇所には、円マークが付けられる。

では実際、内視鏡検査にAIを用いた結果はどうなったでしょうか。2020年11月から21年4月にかけて、国立がん研究センター中央病院と東京慈恵会医科大学附属病院で110人の患者にAIを使って大腸内視鏡検査をしました。それを同じ内視鏡医が過去にAIを使わないで検査をしたときの結果と比較してみました。腺腫発見率（ADR）は、AIを使わなかったときで37％。ADRは内視鏡医の能力を表すものともいえるのですが、アメリカの消化器内視鏡学会が出した声明によると、男性患者を対象にした場合にADRの目標は30％とされています。ですから37％というADRは基準を満たしています。それがAIシステムを併用したところ、52％にまで上がった。15ポイントも上昇したのです。

興味深いのは、医師の経験によってAI併用による効果が異なることです（図4）。内視鏡検査の経験が5年以上ある医師と5年未満の経験しかない医師とで分けてみました、すると、5年以上の経験がある医師のほうは、ADRがAI不使用で41％だったのが、AIを併用することで58％にまで上がりました。でも経験が浅い医師（5年未満）の場合、AI併用によるADRの上昇が小さく、23％から32％の上昇にとどまっていました。また日本消化器内視鏡学会の専門医について調べますと39％が58％に上がり、専門医がやってもADRは上がることが分かりました。

図4 内視鏡検査の経験年数による医師の腺腫発見率（ADR）内視鏡検査の経験が5年以上の医師と5年未満の医師とでは、AI併用での腺腫発見率（ADR）の向上度に顕著な差がある。

この経験の差について、大腸内で内視鏡を動かすのはあくまで人間であるため、AIを併用した大腸内視鏡検査を行うとしても、医師の経験や実力が必要だということが考えられます。熟練した医師なら「この辺りに何かありそうだ」と感じ取り、そこに内視鏡を寄せて詳しく調べます。つまり、AIの使用にかかわらず、病変がありそうな場所に内視鏡を動かさなければ病変は検出できません。内視鏡を動かさないと病変は検知できないですし、内視鏡を動かすには経験が必要ということと考えられます。初学者でのADRの上昇が緩やかであったのは、経験が理由だと思います。

この研究で、想定外の利点がありました。AIを併用することで大腸内視鏡検査に対する患者の受容性が高まる可能性が出てきました。検査室に入る前の段階では、AI併用について患者に意見を聞いたところ、「大変良い」と答えた人と「良い」と答えた人は、合わせて約50％でした。しかし検査を終えてから尋ねると、「大変良い」と「良い」とで約80％に増えたのです。検診中は、一緒にモニターを見てもらいます。従来ですと、医師が病変部位を見つけるとそれを説明したのですが、患者にしてみれば見てもよく分からない。ところがAIが検知してリアルタイムで病変部分を円マークで囲み、医師のほうも「ここにありますね。これを取りましょう」と説明をするので、皆さん「ああ、これがそうなんだ」と理解しやすいのでしょう。「次の内視鏡検査でもAIを併用しますか」という質問には、やはり80％ほどの方が「次も使ってほしい」と答えました。AI併用で、大腸内視鏡検査の受診率が上がるのであれば、これは大きなメリットといえます。

厚生労働省もAI併用の重要性を認識し、医療現場で広く用いられることを目的として、2024年6月1日から「病変検出支援プログラム加算」を認めました。AIを併用した検査で大腸ポリープを検知してそれを切除した場合は、診療報酬算定で加算が認められたのです。

人が発見できない病変は検知できない

ようやく本格的に運用されるようになってきた段階ですが、最後にAI併用大腸内視鏡検査の今後の展望について説明します。

近い将来の実現が待たれるのが、人間には認識が困難な平坦・陥凹性病変をAIに学習させ、それらの検知精度をさらに上げることです。平坦・陥凹性病変は、表面が平らだったりくぼんでいるために、周囲の粘膜との違いが分かりにくく、内視鏡検査で見逃しやすいのです。この病変の画像をしっかりとAIに学習させ、ADRをさらに向上できればと願っています。

また、病変の質的診断についても研究が進行中です。発見した病変がどんな病変なのか、AIと医師が協働して、誤診を少なくする研究が進んでいます。最近、その研究成果の一部である、腫瘍/非腫瘍を鑑別するAIが医療機器承認を受けました（2025年3月）。これで、病変の発見から病理診断予測まで、一気通貫してAIと協働できる状況が整いました。

一方、もっと先の未来でもし実現できれば、大きくブレイクスルーすると思われるものもあります。現在、AIに学習させている病変は、いずれもこれまでに人間が見つけた病変です。それしか学習していないので、AIは人間が見つけられない病変については、それが病変であると検知できません。内視鏡検査に限らず、人間というスーパーバイザーが学習すべきものを与えることで、AIは学んでいくのです。しかし、もしAIが人間の教えなしに自動的に学んでいくよう変化したならば（病変と教えられなくても、ここが病変と気が付くようになれば）……。これまで人間が病変と認知していなかったものでもAIが病変と認知して、がん発生の予防に大きく貢献する可能性があります。

また、大腸内視鏡検査では大腸の中をくまなく見る必要があるのですが、例えば、内視鏡の動きを掃除ロボットのように、AIに任せるという形での進化にも期待したいものです。

AIを用いた大腸内視鏡検査はまだ始まったばかりですが、大腸がん発生の抑止に大きく貢献してほしいと願っています。

（図版提供：山田真善）