NEC、生成AI活用で医療データ二次利用を実証 15万人規模の合成データ作成
掲載日:
NECは3月25日、生成AI(人工知能)と医療情報の知見を活用し15万人規模の「医療合成データ」を作成したと発表した。日本人の統計的特徴を反映した架空の患者データの集合で、医療データの二次利用の推進に活用する。
NECではデータ作成にあたり、大規模な医療合成データの生成、国際的な医療データ分析の共通規格「OMOP(電子カルテやレセプト(診療報酬明細書)などの異なる形式の医療データを共通化した国際規格)」への変換、実際の研究プロセスを模倣したシミュレーションの実証を実施した。

具体的には、データ生成で、AIによる学習と生成AIによる妥当性チェックを組み合わせることで、実際の患者情報を使用することなく、年齢構成、男女比、疾病履歴などの日本人の統計的特性を再現した15万人規模の疑似的な医療データを短期間で合成した。
「OMOP」の変換では、レセプトデータ、DPC(診断群分類)データ、処方FHIRデータ(医療情報交換の国際標準規格「HL7 FHIR」に基づいて処方情報を構造化し表現した電子データ)など、異なる形式のソースを模した合成データを生成した上で、これらのデータを「OMOP」に統合変換し、複数のデータソースを横断した解析が可能であることを確認した。
同時に、「OMOP」に変換したデータが実際の研究プロセスに活用可能かを、愛媛大学と医療データ連携分析基盤協会の有識者と評価した。
評価では、終末期のがん患者の在宅療養支援介入が、病院死の減少や自宅でのみとりに与える影響を分析する「都道府県自治体職員ユースケース」、急性心筋梗塞で入院しPCI(経皮的冠動脈インターベンション)を実施した患者で、PCI実施日が土日祝日である場合、平日と比較した心不全再入院リスクの差異を検証する「救急医学研究者ユースケース」、高齢者への睡眠薬・抗不安薬の長期処方や多剤併用の適正使用動向を把握する「医療政策効果分析担当者ユースケース」の有用性を検証した。
同社によると、実証の結果、変換データが「OMOP」の適合率98%を達成し、研究で有効な解析環境を構築できた。また、将来想定される医療データ共通規格への変換プロセスを先行して実証できた。加えて、医療合成データを使った「データ連結解析(同一の個人や事象に対応する複数のデータセットを、共通の識別子や連結キーを用いて結合し、統合的に分析する手法)」と研究者のニーズに対する先行検証の有効性を示したという。今後は、実証で得たスキームを、さまざまな医療データ二次利用基盤に実装することを検討するとしている。