サイバーセキュリティの新たな盾として、攻撃者のAIを出し抜く防衛システム「Mantis」が登場しました。ジョージメイソン大学の研究者たちによるこのシステムは、大言語モデル(LLM)などの自動攻撃AIを騙し、攻撃を無力化する戦術を用います。
攻撃AIが標的を探し当てようとする際、その動きを見極め、攻撃命令の注入技術で対抗します。この技術により、攻撃AIは本物のサービスと勘違いし、無限ループのような行動を取り続けます。
Mantisの目玉は、攻撃者のAIの動作を分析し、指示を曲げることで攻撃を誤方向に導くことです。研究者たちは、攻撃AIが実際の被害を招かないように、偽のウェブログインページを用意し、そこに攻略命令を埋め込んだテキストを送り返す方法を試しました。これにより、攻撃者に気付かれずに、わざと資源を消費させたり、防衛側に通信口を開かせたりすることが可能になります。
これは、攻撃手法を持つAIの弱点を突く一種の転用であり、多くの場合、攻撃者のLLMを弱体化させることに成功しています。
出典 : AI About-Face: ‘Mantis’ Turns LLM Attackers Into Prey https://www.darkreading.com/cybersecurity-operations/deceptive-framework-defense-mislead-attacking-ai