米Metaが開発した最新の言語モデル「Llama 3.1 70B」をベースに、日本語データの追加学習を行い、サイバーエージェントが新たな言語モデルを発表しました。
この言語モデルは、15兆トークン以上を学習し、他の有名AIモデルを凌ぐパフォーマンスを実現。しかし、元々の「Llama 3.1」は日本語に対応していなかったため、日本のユーザーからは性能に不満の声もありました。
そこでサイバーエージェントがわずか約2日という短期間で、日本語への最適化を図り、その速さに驚きの声が寄せられています。利用規約への同意が必要とはいえ、商用利用可能なライセンスとともにHugging Faceで公開されており、期待が高まっています。
出典 : 「Llama 3.1」の日本語追加学習モデル、サイバーエージェントが公開 SNSでは「爆速すぎる」の声 https://www.itmedia.co.jp/aiplus/articles/2407/26/news150.html