視覚にも理解力を持つAI、新技術「視覚読解」登場

2024.04.30

WorkWonders

NTTが最新技術「視覚読解技術」を発表しました。これは、図表やグラフが含まれる文書も理解できる技術で、オフィス業務の自動化に貢献が期待されます。
従来の読解技術では図表など視覚情報の読取が困難でしたが、「画像エンコーダー」と「LLM」をつなぐアダプター技術により効率的な学習が可能となりました。
多様なタスクに対応するデータセットも開発し、人の指示に基づいて様々な問題を解決します。
特定の情報にさらに学習を加えることで、読解精度が向上するとのこと。
この技術は、既に商用に提供が始まっており、国際的なAI会議でも認められています。

出典 : https://eetimes.itmedia.co.jp/ee/articles/2404/23/news082.html

【このニュース記事は生成AIを利用し、世界のAI関連ニュースをキュレーションしています】

ワークワンダースからのお知らせ

生成AIの最新動向をメルマガ【AI Insights】から配信しております。ぜひご登録ください