中国のDeepSeekが革新的なマルチモーダルAIモデル「Janus-Pro」を公開しました。
このモデルは画像とテキストを組み合わせて理解し、新しいコンテンツの生成が可能です。
視覚情報を扱う新しいフレームワークを採用することで、それまでの問題を克服し、柔軟性の向上に成功しました。
特に、高解像度画像の理解にGoogleの「SigLIP-L」を使用しています。
これにより、画像解析のベンチマークテストでは、他社のAIモデルと比較して優れた成果を示しています。
使用はDeepSeekモデルライセンスに基づき、出力内容の責任はユーザーにあります。
AIの進化に注目が集まる中、このJanus-Proモデルが新たなクリエイティビティを刺激することは間違いありません。
出典 : DeepSeek、マルチモーダルAIモデル「Janus-Pro」をHugging Faceで公開 https://www.itmedia.co.jp/aiplus/articles/2501/28/news110.html