次世代AIの頂点は誰の手に?LMSYSが提供するChatbot Arenaの舞台裏

2024.03.29

WorkWonders

大規模言語モデルの開発には多くの注目が集まっており、それを評価するためにUCバークレー、UCサンディエゴ、カーネギーメロン大学の研究者たちが「Large Language Systems Organization」(LMSYS)を結成しました。
彼らは、LMSYSのChatbot Arenaというプラットフォームを通じて、人類が判定するランダムな対戦を行い、チャットボットのランキングを決定しています。
この方法で、GPT-4は首位を守っていましたが、昨日、Anthropic社のClaude 3 Opusが僅差でGPT-4を追い越しました。
また、サイズが小さく速度が速いClaude 3 Haikuもトップ10に入り、GPT-4クラスと認定されています。
しかし、OpenAIがもうすぐGPT-5を発表する予定であり、競争はさらに激しくなることでしょう。

出典 : https://www.techspot.com/news/102415-gpt-4-loses-position-best-llm-claude-3.html

【このニュース記事は生成AIを利用し、世界のAI関連ニュースをキュレーションしています】

ワークワンダースからのお知らせ

生成AIの最新動向をメルマガ【AI Insights】から配信しております。ぜひご登録ください