Google DeepMindが開発した、新たなマルチモーダル生成AI「Gemini」が発表されました。
このAIは、人工知能の中でも特に注目されている「Transformer」モデルをベースにしていて、テキストや画像だけでなく、音声や動画のようなさまざまな入力に対応し、それを解析して新しいテキストや画像を生成する能力を持っています。
実際には、OpenAIのGPT-4といった他の先進的なAIと比較しても、数々のベンチマークテストで優れた結果を示しています。
Geminiは、事実を重視した学習方法により、AI独自の「幻覚」を最小限に抑えており、例えば、複数のステップからなる計算問題の解法や、動画内の出来事の理解と推論など、高度な認識能力を発揮します。
このAIの進化は、テクノロジーに関する技術レポートや専門書を読むことで、その可能性をより一層理解することができます。
技術革新の波を身近に感じられるGeminiの登場は、科学技術の未来を切り拓く一歩となるでしょう。
興味を持った高校生から専門家まで、ぜひこの技術レポートを読み、次世代AIの深淵に触れてみてください。
出典 : https://note.com/ray_30cm_ns/n/n961ad5649ed2