NTTは、新たな言語モデル「tsuzumi」を用いて文書内の図表を読み取り自然言語で説明できる技術を開発したと発表しました。
この技術により、PDFやHTMLなどで記載された内容をtsuzumiが解釈し、伝票などのデータをJSON形式で抽出することが可能になります。
これにより、オフィス業務が大幅に効率化される見込みです。
NTTは、2024年度内にこの技術を商用利用する予定であり、アダプターを追加学習させてさらなるカスタマイズにも対応します。
顧客は自社の環境でアダプターの学習を行うこともできるため、より細かいニーズに合わせたチューニングが可能です。
出典 : https://xtech.nikkei.com/atcl/nxt/news/24/00565/