2023年、Googleは新しい大規模言語モデル「Gemini」を発表しました。
「Gemini」は、絵や音声、手書きなど様々な情報を理解し、論理的に回答することが特徴です。
例えば、絵を描けば内容を認識し、手品にも対応可能です。
物理のテスト回答を文字認識し、妥当かどうかも判断。
「Gemini」は複数の情報を同時に扱う「マルチモーダル性」を持っており、Googleはこれを基盤技術として全社一丸となって開発しました。
Google のリサーチチームやDeepMind、Brain Teamなどが共同で開発したAIは、新たな技術の躍進を予感させます。
出典 : https://www.businessinsider.jp/post-279519