医療の問題解決を専門とするAIの性能を向上させるために、新しい技術として「Medprompt」が開発されました。この技術は、医疗関連の質問に特化した大規模言語モデル(LLM)を使用し、テストの選択肢をランダムに並び替えて、同じ質問の異なるバリエーションを生み出します。そして、これらのバリエーションごとに理由を導き出し、答えを生成するようLLMにプロンプトします。
最終的には、すべてのバリエーションからの予測に対して多数決を取り、最も多かった予測を最終的な答えとします。
MedQAデータセットを使用しており、さまざまな例を用いて予測の精度を高めています。また、答えの精度をさらに上げるため、KNNモデルを使用して類似する質問を検索し、それらを活用しています。
Medpromptは、LLMの性能を向上させる新たな手法として、AIの資源とコストの効率性の潜在性を示しています。さらに、研究では、従来の手法に比べ、Medpromptや自己生成CoTプロンプトによって、より優れた成績が得られることが明らかになりました。
これらの結果から、AIが医療分野の専門知識を持つかのように振る舞うことが可能であると示唆されています。
出典 : https://towardsdatascience.com/understanding-and-implementing-medprompt-77bbd2777c91