ゲーム会話の作成から小説のシーン執筆まで、私たちはAIの創造性を30のタスクで試しました。その結果、GPT-4はクオリティの高さでClaude 3 Opusをしのぐことが多かったですが、Claudeには思いもよらない独創的な回答がありました。
この実験では、私(人間)と、GPT-4、Claude 3 Opusがそれぞれの出力について評価。すべてのプロンプト、モデルの回答、そして評価結果はGoogleスプレッドシートで共有しています。この前代未聞のAI対決にどうぞご注目ください。
興味を持ったら、特に面白い評価方法やタスクの種類の分析をチェックしてみてください。GPT-4とClaudeのどちらがあなたの好みに合うか、スプレッドシートで決めてみませんか?
出典 : https://note.com/oshizo/n/nfc5652fdd5a1