金融分野に革命をもたらす「EDINET-Bench」開発の全貌

2025.06.10

WorkWonders

Sakana AI株式会社が、会計不正を発見するなどの高度な金融タスクの性能評価用として「EDINET-Bench」を開発しました。
金融庁の電子開示システム「EDINET」を用いて、上場企業の有価証券報告書約41,000件を集め、ラベルを自動的に付与する独自の方法で日本語金融ベンチマークを構築。このベンチマークはHugging FaceやGitHubにて公開され、金融AIの進化に貢献しています。
LLMの金融分野への応用は発展途上であり、実用に耐えるタスクの性能を測るベンチマークが求められていた中での大きな一歩です。
今後も特化型LLMの開発により、金融タスク対応力を高め、AI実装の研究開発を進めるとしています。

出典 : 有価証券報告書を用いた日本語金融LLMベンチマーク「EDINET-Bench」、Sakana AIが公開/高度な金融タスクにてAIがどの程度対応できるかを評価 https://forest.watch.impress.co.jp/docs/news/2020947.html

【このニュース記事は生成AIを利用し、世界のAI関連ニュースをキュレーションしています】

ワークワンダースからのお知らせ

生成AIの最新動向をメルマガ【AI Insights】から配信しております。ぜひご登録ください

↓10秒で登録できます。↓