日本の超コンピューター「富岳」を使って開発された新しい大規模言語モデル「Fugaku-LLM」が公開されました。
このモデルは、13億のパラメータを有し、特に日本語の能力が強化されており、研究やビジネスでの活用が期待されています。
東京工業大学、東北大学、富士通、理化学研究所などのコンソーシアムにより、言語モデルの分散トレーニング手法が開発され、富岳の性能を最大限に引き出すための技術が確立されました。
「Fugaku-LLM」は、他のオープンモデルと比べて優れた性能を示しており、GitHubやHugging Faceで利用可能です。
今後、より多くの研究者とエンジニアが改良に参加することで、次世代の革新的な研究やビジネスアプリケーションに繋がることが期待されます。
出典 : https://www.fujitsu.com/global/about/resources/news/press-releases/2024/0510-01.html