OpenAIのChatGPTが人気を博していましたが、AI研究者が使用する人気のリーダーボードでAnthropicの最先端モデル「クロード3オーパス」が首位を奪取しました。これは、OpenAIのGPT-4がリーダーボードに初登場して以来、初めてのことです。
Chatbot Arenaというプラットフォームでは、ユーザーがラベルのない二つの言語モデルを比較し、優れていると思う方を選びます。そして、そのフィードバックを集約し、Bradley-Terry統計モデルを用いてランキングを更新しています。
また、GoogleのGeminiも注目されており、2TBのストレージとAI機能を月額$20で提供しています。
クロードが特に優れているのは、200Kトークン以上を処理できる記憶力と、長いプロンプトでの情報保持能力です。これにより、GPT-4 Turboが長いプロンプトでの記憶能力を失うのに対し、より効果的に情報を保持できます。
世界のAIアシスタント市場は激動の変化を見せており、各モデルの競争が激化しています。
出典 : https://decrypt.co/223787/anthropic-claude-ai-versus-openai-chatgpt-llm-arena-ranking