Livetoon、富士通とエヌビディアのヘルスケアAIエージェント実証実験に音声技術を提供
掲載日:

AI(人工知能)技術開発のLivetoon(ライブトゥーン、東京・中央区)は10月3日、富士通、米エヌビディアが手掛けるヘルスケアAIエージェントの実証実験に、音声合成と音声認識技術を提供したと発表した。
富士通とエヌビディアのヘルスケア特化型AIエージェント実行基盤の構築プロジェクトに参画した。プロジェクトは、医療機関の経営効率化と安定的な医療サービスの提供を目的に、受付や問診、診療科分類などの業務を自動化するAIエージェントの開発を進めている。
ライブトゥーンは、日本語音声合成技術で、同社の「Livetoon TTS」を提供。「Livetoon TTS」は、短文120ミリ秒、長文760ミリ秒の最速級処理速度、エンタメ域91.5%でビジネス域9%の読み上げ精度、専門用語や漢字の読み分けを高精度で処理する医療用語対応、患者に寄り添う温かみのある音声表現といった機能を持つ。
音声認識技術では「ASR/STT」を提供した。リアルタイム処理や問診や受付での自然な対話を正確にテキスト化する医療現場対応、医療現場特有の環境音にも対応するノイズ耐性を備える。
9月24日にはエヌビディアが開催したAIイベントで、プロジェクトで開発したPoC(概念実証)のデモンストレーションを実施。AIエージェントは医療現場の実際のユースケースに基づいて動作し、参加者から高い評価を獲得したという。
今後はプロジェクトの成果を踏まえ「医療特化型音声モデルの開発強化」「ヘルスケアAIエコシステム」「新たなユースケース開発」に取り組む。
「医療特化型音声モデルの開発強化」は、医療用語辞書の拡充、クローン音声技術による個別化対応、多言語対応の検討を行う。「ヘルスケアAIエコシステム」は、エヌビディアの「NVIDIA NIMマイクロサービス」との統合深化するほか、富士通の「Healthy Living Platform」での展開、他の医療機関への横展開を支援する。「新たなユースケース開発」では、遠隔診療支援システム、医療従事者向け音声入力システム、患者向け服薬指導・健康管理アプリケーションで技術を活用する。