日本を代表する研究機関と企業が集結し、スーパーコンピュータ「富岳」を駆使して新しい大規模言語モデル「Fugaku-LLM」を開発しました。
130億パラメータを有するこのモデルは、サイバーエージェントの日本語データを活用し、高性能ながら扱いやすいサイズに仕上がっています。人文社会系タスクにおいては国内最高水準のパフォーマンスを達成しており、自然な敬語を含む対話も期待できます。
開発チームは富岳の能力をフル活用することで、学習速度を大幅に向上させました。現代のGPU不足の課題をクリアして、日本の半導体技術を前面に押し出す成果は経済安全保障の面でも重要な意味を持ちます。Fugaku-LLMはGitHubやHugging Faceで公開されており、ライセンスを遵守すれば誰でも利用できます。
出典 : https://monoist.itmedia.co.jp/mn/articles/2405/15/news056.html