GoogleのDeepMindは、OpenAIのChatGPTに対抗するために、新しいAIモデル「ジェミニ」を発表しました。ジェミニは、従来のLaMDAなどの生成型AIモデルと異なり、「マルチモーダルモデル」として開発されており、テキストだけでなく、画像、オーディオ、ビデオも直接扱うことができます。
また、Gemini 1.0 Proは現状GPT-4には劣るとされていますが、よりパワフルなバージョンのGemini 1.0 Ultraの存在も示され、その性能には注目が集まっています。しかし、Ultraの独立した検証がまだなされていないため、その真価は未だ不明です。
これに対して、OpenAIもGPT-4Visionを発表しており、画像や音声の扱いに関しては進展が見られますが、ジェミニが目指す完全なマルチモーダル性にはまだ至っていません。
Googleが高性能だが軽量なGemini Nanoの存在も公表しており、プライバシーや環境への影響を考慮したAIモデルが今後の競争を促進するでしょう。AI技術の新たな飛躍を目の当たりにする可能性があります。
出典 : https://theconversation.com/googles-gemini-is-the-new-ai-model-really-better-than-chatgpt-219526