Appleの新AIモデル「OpenELM」が業界に新風を巻き起こす

2024.04.30

WorkWonders

Appleが新たなAIモデル「OpenELM」をリリースしました。このモデルは、従来の公開データセットでトレーニングされた他の言語モデルを凌駕する性能を発揮します。OpenELMは特に、パフォーマンスの向上を実現しながらも、過去のモデルよりも少ないトークンで事前学習が可能です。

Appleは、モデルだけでなくトレーニングと評価のフレームワークを公開することで「オープンさ」をアピールしています。ただし、同社は公開ソフトウェアのライセンスを認定はしておらず、派生作品がAppleの権利を侵害したとみなされた場合、特許請求の権利を予約していることを明確にしています。

OpenELMは、トランスフォーマーモデルでパラメータをより効率的に割り当てる「レイヤーワイズスケーリング」という技術を利用し、ベンチマークテストでのモデルの正確な予測率を向上させています。モデルは、プロンプトに基づいて回答や自動補完を試みるもので、Appleデバイス上での推論とファインチューニングMLXライブラリへのモデル変換コードも添付されています。

AquantのCEOであるShahar Chenは、OpenELMリリースがAIコミュニティにとって効率的なオンデバイスAI処理という大きな進歩をもたらすものだと語っています。これにより、スマートフォンからスマートホームデバイスまで、日常技術にAIを取り入れる可能性が広がります。

しかし、精度は高いものの、パフォーマンスではやや劣るという問題が報告されています。Appleは、将来的な最適化を検討するとしています。このモデルは様々なパラメータ数でプレトレーニングされたバージョンが利用可能で、研究コミュニティへの貢献を目的に公開されていながらも、安全性の面では保証がないとしています。

出典 : https://www.theregister.com/2024/04/24/apple_openelm_ai/

【このニュース記事は生成AIを利用し、世界のAI関連ニュースをキュレーションしています】

ワークワンダースからのお知らせ

生成AIの最新動向をメルマガ【AI Insights】から配信しております。ぜひご登録ください

↓10秒で登録できます。↓