Googleが新たな視覚言語モデル「PaliGemma」を発表しました。
このモデルは、画像や動画などの視覚的要素に基づいて自然言語の出力が可能という画期的な技術です。
さらにGoogleは、より強力な大規模言語モデル「Gemma 2」も間もなく公開すると明らかにしました。
「Gemma 2」は、既存の「Gemma」と比較して大幅に性能が向上しており、米Metaの巨大な言語モデルと同等の力を持つとのことです。
数週間以内に公開される予定で、今後の進展が非常に注目されています。
出典 : https://www.itmedia.co.jp/aiplus/articles/2405/15/news086.html