Appleの革新「MM1」- 画像と言語を理解する新たなるAI

2024.03.21

WorkWonders

Appleが14日に発表した最新の言語モデル「MM1」は、画像とテキストの両方を理解することができる高性能なAIです。
30億、70億、300億パラメータを持つモデルと、専門家の集合体であるMoEを用いたモデルが、従来の同規模のシステムよりも優れた性能を示しています。
研究チームは、AIの設計過程における重要な判断やデータ選択の影響を明らかにし、画像の解像度や、ビジュアルデータの処理方法が性能に大きく影響することを発見しました。
事前学習に使う画像とキャプションのデータ組み合わせが重要であり、その適切な選択が高い性能を実現する鍵となることが分かりました。
Appleのこの研究は、将来のAI技術向上に重要な一歩となることは間違いありません。

出典 : https://pc.watch.impress.co.jp/docs/news/1577667.html

【このニュース記事は生成AIを利用し、世界のAI関連ニュースをキュレーションしています】

ワークワンダース社は、生成AIの活用・導入について客観的な立場からご相談に応じています。

生成AIに関するご相談はこちらからご連絡ください。 当社のご支援実績はこちらからご確認ください。