人間さえ答えられない複雑な問題を解決できるか、AIの挑戦が始まりました。「不可能性テスト」と呼ばれるこの新たな試みでは、生物学、物理学、数学、
哲学などの分野から集められた675の解答不能な問題にAIがどのように答えるかを検証しています。試験の鍵は、正解がただひとつ「分かりません」という選択肢にある点です。
実際のテストでは、各種AIモデルがどれだけ自分の限界を正直に認めることができるかが測られました。名だたるAIモデルが参加し、その中で68%の正解率を記録したモデルもありましたが、一般のオープンソースモデルも健闘。
問題の難しさに応じてAIの正解率に違いが見られ、難しい問題ほど高い正解率を示したのです。このテストは、AIが本当の汎用性を持つための重要なステップとして期待されています。
出典 : AIは無知をどこまで認識できるか? 人類が回答不可能な質問をGPTやClaude、Geminiなどに大量にぶつけてみた(生成AIクローズアップ) https://www.techno-edge.net/article/2024/12/16/3930.html