私たちは、自宅で症状を経験している患者や救急部門の患者の専門分野、トリアージレベル、診断を予測できるモデルの開発を目指しました。データセットは、症状の説明と患者の基本情報が一般ユーザーによって、また臨床ユーザーには初期のバイタルサインも含めて入力されるように設計されました。
MIMIC-IV EDデータセットとMIMIC-IV Notesデータセットの膨大な情報を使用し、トリアージ情報や患者の人口統計、初期バイタルサイン、無秩序な臨床ノートからのデータを統合しました。
クロード3.5ソネットなどの先進的なLLM(Large Language Models)が使用され、医療の意思決定に必要な情報を提供します。クロードモデルは、文章の解釈、効率性、専門的なクエリの処理能力において優れています。さらに、RAG(Retrieval-Augmented Generation)支援LLMアプローチが、より正確で信頼性のある出力の獲得を目指しています。
このモデルは、トリアージレベルの予測、医療の専門分野の推薦、診断の予測において、実際の専門家の評価と対比して検証されました。その結果、LLMは信頼性のあるサポートツールとして機能し得ることが示されています。これにより、AIが臨床的な判断をサポートし、迅速かつ効果的な医療の補助として機能する未来が予測されます。
出典 : Evaluating large language model workflows in clinical decision support for triage and referral and diagnosis – npj Digital Medicine https://www.nature.com/articles/s41746-025-01684-1