NHK放送技術研究所は、放送局の膨大なニュースデータを学習した大規模言語モデル(LLM)を開発しています。
このLLMは、単にテキストを予測するだけでなく、翻訳や要約などさまざまな放送局業務において利用可能です。
しかし、以前は不正確な回答をする問題点もありました。
そこで、約40年分のニュース原稿や字幕など2000万文を追加学習させることで、ニュースに関する正確な理解を可能にしました。
評価実験では、誤回答が10%減少し、時事知識の獲得も確認されました。
それでもなお改良が必要で、番組制作支援や情報収集の支援などを視野に入れ、2026年の実用化目指して研究が進められます。
技術展「技研公開2025」での展示も予定されており、今後は映像や音声データも扱うマルチモーダル化にも挑戦していきます。
これにより、より信頼性と機能性に富んだLLMの開発が期待されます。
出典 : NHK、40年分の放送局データを用いた大規模言語モデルを開発。大量の情報収集・翻訳・校正などを支援 https://www.phileweb.com/news/d-av/202505/26/62741.html