AI対決: GPT-4 vs Claude 3 Opus – 30のタスクで測る創造力

2024.03.26

WorkWonders

ゲーム会話の作成から小説のシーン執筆まで、私たちはAIの創造性を30のタスクで試しました。その結果、GPT-4はクオリティの高さでClaude 3 Opusをしのぐことが多かったですが、Claudeには思いもよらない独創的な回答がありました。
この実験では、私(人間)と、GPT-4、Claude 3 Opusがそれぞれの出力について評価。すべてのプロンプト、モデルの回答、そして評価結果はGoogleスプレッドシートで共有しています。この前代未聞のAI対決にどうぞご注目ください。
興味を持ったら、特に面白い評価方法やタスクの種類の分析をチェックしてみてください。GPT-4とClaudeのどちらがあなたの好みに合うか、スプレッドシートで決めてみませんか?

出典 : https://note.com/oshizo/n/nfc5652fdd5a1

【このニュース記事は生成AIを利用し、世界のAI関連ニュースをキュレーションしています】

ワークワンダースからのお知らせ

生成AIの最新動向をメルマガ【AI Insights】から配信しております。ぜひご登録ください

↓10秒で登録できます。↓