第261回自然言語処理研究発表会で明らかにされた、大規模言語モデル(LLM)に日本語を学習させる効果に関する新たな研究成果です。
東京工業大学と産業技術総合研究所の研究者グループは、LLMに35種類の日本語と英語のタスクを行わせることで、その効果を徹底比較分析しました。
特に、日本固有の質問応答や英日翻訳では、日本語資源の学習が性能向上に大きく寄与することが示されました。
一般教養や算術推論、コード生成等、英語資源から獲得できる能力も存在しますが、日本語特有の課題では日本語資源が重要だという興味深い結果が得られました。
今後のLLM開発戦略にとって指針になりえるこの研究。論文は本会議で詳しく発表されます。
出典 : なぜAIに“日本語”を学習させるのか? 35種類のLLMで実験し分析 東工大などが研究報告 https://www.itmedia.co.jp/aiplus/articles/2409/17/news053.html