パロアルトネットワークスのUnit 42の研究によると、人気のAI生成ウェブアプリケーションの多くが、さまざまなジェイルブレイク技術によって侵害されるリスクがあることが明らかになりました。
これらの脆弱性は、不正利用者がAIの安全メカニズムを突破し、機密情報を抽出したり、有害なコンテンツを生成したりする可能性があります。
特に、複数回答の戦略が、アプリケーションの安全性を破る行為に非常に効果的で、成功率が39.5%から54.6%に達する一方で、一回限りの戦略では20.7%から28.3%の範囲にとどまりました。
セキュリティ専門家は、複数のフィルタを使用し、最大限のコンテンツフィルタリング設定を適用することで、これらの脆弱性を緩和することを推奨しています。
また、特に承認されていない第三者アプリケーションを使用している従業員を監視するセキュリティ対策を施行することが大切です。
出典 : Researchers Jailbreaked 17 Popular LLM Models To Communicate Sensitive Data https://cybersecuritynews.com/researchers-jailbreaked-17-popular-llm-models/