Meta社のジェネレーティブAI担当副社長、アーマド・アル-ダーレが競合のソーシャルネットワークX上で、新しいオープンソースの多言語大規模言語モデル「Llama 3.3」のリリースを発表しました。
Llama 3.3は、前作よりもコストパフォーマンスが格段に向上しており、オープンソースコミュニティ全体にとってさらに手の届きやすいモデルとなっています。
70億のパラメーターを搭載しながらも、Metaの以前の4050億パラメーターモデルと同等の性能を発揮し、GPUメモリや計算資源のコストを大幅に削減しています。
開発者は、非独占的かつ無償のライセンスである「Llama 3.3コミュニティライセンス契約」の下でモデルを利用でき、適切なクレジット表示を条件に組み込みが可能ですが、
700億以上の月間アクティブユーザーを持つ組織には商業ライセンスが要求されます。
Llama 3.3は独自の改善を加え、マルチリンガルを含むNLPタスクで強力なパフォーマンスを発揮し、新しいプログラミングタスクにおいても他の最先端モデルと競合します。
このモデルは、15兆のトークンで事前学習し、2500万の合成データで微調整が行われており、
コスト効率と環境への配慮を両立させています。
長文コンテンツ生成やその他の高度な用途に適した長いコンテキストウィンドウを備え、ユーザーの安全性と有用性に合わせて設計されており、リアルワールドアプリケーションでの助手のような動作が期待されます。
ダウンロードはM
出典 : Meta launches open source Llama 3.3, shrinking powerful bigger model into smaller size https://venturebeat.com/ai/meta-launches-open-source-llama-3-3-shrinking-powerful-bigger-model-into-smaller-size/