Ciscoが2025年2月に公開したブログによると、AIに対するサイバー脅威の研究は、進化が早く、新たな脆弱性から保護するために不可欠です。
シングルターンクレッシェンド攻撃(STCA)は、一回のインタラクションで複数のAIモデルを攻撃する新しい手法であり、論争を生むような内容を引き出すものです。
また、SATAと呼ばれる方法では、補助的なタスクを利用して、AIの保護機能を回避し、攻撃成功率を大幅に高めます。
さらに、ニューラルキャリア記事を使った脱獄手法も有効で、比較的低い障壁でAIの警戒機能をかいくぐれることが示されました。
これらの研究からは、LLMの敵対的な攻撃がさらに広範囲に及ぶ可能性があるため、より深い探究が求められています。
出典 : 最先端LLMを狙う新たな攻撃手法とは? Cisco SystemsがAI脅威動向を解説 https://atmarkit.itmedia.co.jp/ait/articles/2502/18/news080.html