AIの誤情報を克服!データジェンマが拓く信頼性の新境地

2024.09.13

WorkWonders

現代のAI技術を支える大規模言語モデル(LLM)がますます高度化しています。膨大なテキストを分析し、要約したり、新しい創造的な方向性を提案したり、さらにはコードを作成することもできます。しかし、これらの能力が印象的である一方で、LLMは時に不正確な情報を自信を持って提示することがあり、この「幻覚」と呼ばれる現象は、生成AIの大きな課題です。

この課題に直接取り組む有望な研究進展を共有する今日、実際の統計情報にLLMを基づけることで幻覚を減らす助けになります。研究の進展とともに、Googleのデータコモンズから引き出した広範な実世界データをLLMと接続する最初のオープンモデル「データジェンマ」を発表します。

データコモンズは、公開されている信頼できるデータの膨大なリポジトリで、国連(UN)や世界保健機関(WHO)、疾病予防管理センター(CDC)、各国の統計局などの信頼できる組織からの情報を豊富に集めています。これらのデータセットをひとつに統合し、政策立案者や研究者、正確な洞察を求める組織に力を与えます。

データジェンマは、データコモンズの知識を活用し、Gemmaモデルの能力を拡大することで、LLMの事実確認と推論を強化します。たとえば、DataGemmaが応答を生成するよう求められたとき、モデルは統計データの例を特定し、Data Commonsから答えを取得するようにプログラムされています。RIG(Retrieval-Interleaved Generation)が新しい手法ではないものの、DataGemmaフレームワーク内でのその特定の応用は画期的です。

出典 : DataGemma: Using real-world data to address AI hallucinations https://blog.google/technology/ai/google-datagemma-ai-llm/

【このニュース記事は生成AIを利用し、世界のAI関連ニュースをキュレーションしています】

ワークワンダース社は、生成AIの活用・導入について客観的な立場からご相談に応じています。

生成AIに関するご相談はこちらからご連絡ください。 当社のご支援実績はこちらからご確認ください。