オルツは新たに、「ハルシネーション自動評価エンジン」を開発しました。
これは大規模言語モデルが根拠のない回答をしてしまう「ハルシネーション」と呼ばれる現象に対応する技術です。
このエンジンを使用することで、ハルシネーション発生の可能性がある回答を評価し、その確率を示します。
実際にハルシネーション判定の正解率は72%を実現しており、様々なモデルで使用が可能です。
さらに、生成された回答内容の一貫性を確かめ、誤りを検出できます。
この技術は「alt developer」のAPIサービスとしても提供されます。
これにより、より信頼できる言語モデルの利用が進むことでしょう。
出典 : https://ascii.jp/elem/000/004/199/4199000/