AI対決: GPT-4 vs Claude 3 Opus – 30のタスクで測る創造力

2024.03.26

WorkWonders

ゲーム会話の作成から小説のシーン執筆まで、私たちはAIの創造性を30のタスクで試しました。その結果、GPT-4はクオリティの高さでClaude 3 Opusをしのぐことが多かったですが、Claudeには思いもよらない独創的な回答がありました。
この実験では、私(人間)と、GPT-4、Claude 3 Opusがそれぞれの出力について評価。すべてのプロンプト、モデルの回答、そして評価結果はGoogleスプレッドシートで共有しています。この前代未聞のAI対決にどうぞご注目ください。
興味を持ったら、特に面白い評価方法やタスクの種類の分析をチェックしてみてください。GPT-4とClaudeのどちらがあなたの好みに合うか、スプレッドシートで決めてみませんか?

出典 : https://note.com/oshizo/n/nfc5652fdd5a1

【このニュース記事は生成AIを利用し、世界のAI関連ニュースをキュレーションしています】

ワークワンダース社は、生成AIの活用・導入について客観的な立場からご相談に応じています。

生成AIに関するご相談はこちらからご連絡ください。 当社のご支援実績はこちらからご確認ください。