AI安全性ランキング、最新のLLMを評価

2024.05.10

WorkWonders

エンクリプトは、AIの世代において、大規模言語モデル(LLM)の安全性がパフォーマンスと同様に重要であると認識し、
LLM Safety Leaderboardを発表しました。このボードは、安全性と信頼性のリスクに対する言語モデルの脆弱性を評価するものです。

例えば、OpenAIのGPT-4-Turboが低いリスクスコアでトップに輝き、ジェイルブレイク攻撃への強さを示していますが、バイアスやマルウェアの問題もあることが分かりました。一方、評価が低かったモデルも存在し、
これらのモデルは企業による安全性の確認やバイアスの除去に大きな影響を与える可能性があります。

エンクリプトは将来にわたりリーダーボードを更新していくと述べており、これによって企業は安全なAIモデルの選定や、その利用方法について洞察を得ることができるでしょう。
これは企業が安全で倫理的なAI技術を追求し、信頼を築くための一つの足がかりとなります。

出典 : https://venturebeat.com/security/looking-for-reliable-ai-enkrypt-identifies-safest-llms-with-new-tool/

【このニュース記事は生成AIを利用し、世界のAI関連ニュースをキュレーションしています】

ワークワンダースからのお知らせ

生成AIの最新動向をメルマガ【AI Insights】から配信しております。ぜひご登録ください