Appleが14日に発表した最新の言語モデル「MM1」は、画像とテキストの両方を理解することができる高性能なAIです。
30億、70億、300億パラメータを持つモデルと、専門家の集合体であるMoEを用いたモデルが、従来の同規模のシステムよりも優れた性能を示しています。
研究チームは、AIの設計過程における重要な判断やデータ選択の影響を明らかにし、画像の解像度や、ビジュアルデータの処理方法が性能に大きく影響することを発見しました。
事前学習に使う画像とキャプションのデータ組み合わせが重要であり、その適切な選択が高い性能を実現する鍵となることが分かりました。
Appleのこの研究は、将来のAI技術向上に重要な一歩となることは間違いありません。
出典 : https://pc.watch.impress.co.jp/docs/news/1577667.html