大規模言語モデルの開発には多くの注目が集まっており、それを評価するためにUCバークレー、UCサンディエゴ、カーネギーメロン大学の研究者たちが「Large Language Systems Organization」(LMSYS)を結成しました。
彼らは、LMSYSのChatbot Arenaというプラットフォームを通じて、人類が判定するランダムな対戦を行い、チャットボットのランキングを決定しています。
この方法で、GPT-4は首位を守っていましたが、昨日、Anthropic社のClaude 3 Opusが僅差でGPT-4を追い越しました。
また、サイズが小さく速度が速いClaude 3 Haikuもトップ10に入り、GPT-4クラスと認定されています。
しかし、OpenAIがもうすぐGPT-5を発表する予定であり、競争はさらに激しくなることでしょう。
出典 : https://www.techspot.com/news/102415-gpt-4-loses-position-best-llm-claude-3.html