富士フイルム、読影結果を活用可能に整理する「読影レポート構造化AI」開発

富士フイルムは3月27日、放射線科医が作成する、CT(コンピューター断層撮影装置)やMRI(磁気共鳴画像)などで撮影した医用画像の読影レポートを構造化する独自の自然言語処理技術「読影レポート構造化AI」を開発したと発表した。

「読影レポート構造化AI」は、「所見文/臓器判定AI」「所見用語抽出AI」「事実性判定AI」「関係性抽出AI」「同義語辞書参照と構造化」の5つのプロセスで読影レポートを構造化する。「構造化」とは、文書を構成する要素を分解し、それぞれの関係性を一定の規則に則して整理することを指す。

富士フイルム、読影結果を活用可能な形に整理する「読影レポート構造化AI」開発
富士フイルム、読影結果を活用可能な形に整理する「読影レポート構造化AI」開発

具体的には、「所見文/臓器判定AI」で、読影レポートに記載された、内容を説明する「所見文」や、日時や伝言などの「非所見文」といった文章が所見文か非所見文かを判定すし、所見文がどの臓器に関して書かれているかを判別する。

「所見用語抽出AIでは、所見文に含まれる「画像所見内容」「診断情報」「解剖学的位置情報」「性状などの補足情報」「計測値情報」「経時変化情報」などの情報を固有の用語を抽出することで、情報ごとに分割する。

「事実性判定AI」は、「~を認めません。」「~を否定しきれません。」「~の可能性も排除できません。」といった、所見文に含まれる、医師特有の言い回し表現の事実性(所見や病変の有無)を判定する。「関係性抽出AI」では、「所見用語抽出AI」で抽出された、所見文中の要素の関係性を解釈し、内容を所見ごとに整理する。

「同義語辞書参照と構造化」は、北米放射線学会のRSNAの放射線医学に特化したRadLex(国際標準読影用語インデックス、約6万4000語)、奈良先端科学技術大学院大学の医学全般対象の万病辞書(約36万語)といった公開されているコーパス(辞書)を参考に所見文に使用される表現の意味と関係性を理解し、同義語辞書(約28万語)として整備。異なる表現で所見文が記載されていても、その情報は一意に同じ情報として構造化できるようにした。

富士フイルムは、開発した構造化AIの評価を実施。その結果、所見文の約7割を占める比較的単純な所見文で90%以上、より複雑な主訴(患者の主な症状と診断画像の主な撮影目的)の所見文では約80%の精度で自動的に構造化できることを確認した。

読影レポートはこれまで、医師特有の言い回しや医学専門用語を含んだ非定型の自由文で記載されており、構造化が難しく、レポートの記載内容をそのまま統計情報の作成やAI(人工知能)の学習データ、プログラム開発などでの利用は困難だったという。

富士フイルムでは、大阪大学大学院医学系研究科人工知能画像診断学共同研究講座(富山憲幸教授、堀雅敏特任教授)が構築した過去10年分以上のCTとMRI検査など、約20万件の読影レポートのデータセットを活用することで、構造化技術を確立した。今回の技術で、医師特有の言い回しや医学専門用語を含む読影レポートでも効率的にデータベース化し活用できるようになる。

今後は、技術を活用することで「過去の類似所見検索」「各所見の発生確率の統計情報可視化」「新規患者に対する所見例提示」といった、従来では開発が困難だった、高度な診断支援AIとIT技術が可能になるという。また、生成AIの回答精度を向上する「検索拡張生成AI(RAG)」と、構造化技術で構築したデータベースを使って「放射線科医の読影のアシスタントAI」の開発も可能になる。

加えて、データベースと医用画像内の所見位置をひもづける技術を開発することで、さまざまな疾患に特化した画像診断支援機能の正解データを自動的に大量生成できるようになり、全身の異常疾患を網羅的に見つけるAIの開発が見込めるとしている。