カリフォルニア大学のHao AI Labでは、AIの推論力を測る新たな挑戦が行われました。
彼らは、法廷を舞台にした複雑なゲーム「逆転裁判」をAIにプレイさせ、その推論力を試験しています。
このタスクは長文の理解、画像からの情報収集、戦略的な意思決定を必要とし、AIにとって難題です。
テストでは複数のAIモデルが比較され、o1とGemini 2.5 Proが優れた成績を示しました。
特にGemini 2.5 Proはコストパフォーマンスに優れ、一部のケースではo1よりもはるかに安価に動作します。
この実験により、AIが複雑な推論を行うことの可能性が示されつつあります。
出典 : AIに「逆転裁判」をプレイさせ、推論能力が一番高かったのはどのLLM?(生成AIクローズアップ) https://www.techno-edge.net/article/2025/04/21/4297.html