AIの進化を「自転車に乗るペリカン」でチェック!驚きの描画力対決

2025.06.10

WorkWonders

AI技術の進化が目覚ましい今、新たなベンチマークとして登場したのが「自転車に乗ったペリカンを描く」というユニークなテストです。サイモン・ウィリソン氏が考案したこのテストで、AIの芸術的な能力が競われ、異色のAIベンチマークとして着目を集めています。
2025年6月、AIエンジニアワールドフェアにおいて、ウィリソン氏は最新成果を報告しました。たとえば、Metaの「Llama 3.3 70B」やGoogleの「Gemini」、そしてAmazonの「Nova」など、名立たるAIの潜在能力がこのベンチマークによって測定されています。
驚きの結果として、DeepSeek-R1は鳥と自転車を優れたバランスで描き、Anthropicの「Claude 3.7 Sonnet」はほとんど文句なしの作品を出力しました。
ウィリソン氏はこのテストを始めた当初は冗談からだったと言いますが、現在ではAI能力の尺度として見込みがあると述べています。この競争は、技術の限界を楽しく探る一助となっています。

出典 : AIベンチマーク「自転車に乗ったペリカンを描く」をLLama 3.3 70BやGPT 4.1にやってもらうとこうなる https://gigazine.net/news/20250609-llms-pelicans-on-bicycles/

【このニュース記事は生成AIを利用し、世界のAI関連ニュースをキュレーションしています】

ワークワンダースからのお知らせ

生成AIの最新動向をメルマガ【AI Insights】から配信しております。ぜひご登録ください

↓10秒で登録できます。↓