日本の研究チームが、国産スーパーコンピュータ「富岳」を活用し、日本語の理解能力を強化した大規模言語モデル「Fugaku-LLM」を開発しました。
このモデルは130億のパラメータを持ち、従来の日本で開発された7億のパラメータモデルよりも大きく、特に人文社会科学の分野では最高の性能を示しています。
「Fugaku-LLM」は独自に収集した日本語データと他言語データを使用しており、日本製データでトレーニングされた公開モデルの中で最も優れています。
GitHubおよびHugging Faceでコードが公開され、研究と商用目的で利用可能です。
今後、この成果を活かし、科学シミュレーションとAIの生成やバーチャルコミュニティの社会シミュレーションなど、次世代の革新的な研究とビジネスが期待されています。
出典 : https://www.hpcwire.com/off-the-wire/researchers-in-japan-develop-fugaku-llm/