東京科学大学と産業技術総合研究所の共同研究により、日本語に特化した大規模言語モデルが開発されました。
このモデルは、既存の英語モデルを土台としており、国内外の膨大なデータをもとに学習が進められました。
その結果、日本語でのパフォーマンスが著しく向上し、世界的に知られるGPT-4oモデルに匹敵する能力が得られました。
従来比で日本語理解・生成における平均スコアが2.8ポイント上昇するなど、大幅な進歩を遂げています。
研究チームは更なる改善の余地があるとしながらも、人文科学やライティングなどの分野での優れた能力を評価しています。
「Llama 3.3 Swallow」は、研究や商用目的で広く利用可能となっており、これからの進化に期待が集まります。
出典 : GPT-4oに迫る日本語能力に強化された「Llama 3.3 Swallow」、東京科学大学などの研究チームが公開/特定のライセンスと利用規約のもとで商用可能 https://forest.watch.impress.co.jp/docs/news/1669875.html