AIのセキュリティリスクに警鐘!新たな攻撃手法「Bad Likert Judge」の脅威

2025.01.04

WorkWonders

パロアルトネットワークスのサイバーセキュリティチーム「Unit 42」が、大規模言語モデル(LLM)を利用した新しい脅威に対し警告を発しています。この手法は「Bad Likert Judge」と名付けられ、LLMに有害な内容のスコア付けをさせることで、有害な反応を引き出すものです。
リカート尺度を使用し、ユーザーがある発言にどれだけ同意するかを測定してから、同じ尺度に合わせた回答を生成させると、有害な内容を含むことが出来ます。
この技術は6つの先進的なテキスト生成LLMにおいて広範囲にわたってテストされ、攻撃成功率が平均60%以上向上することがわかりました。

研究は、守り手がこの手法を使った攻撃に備えるのに役立つことを目的としていますが、あくまでも特定のエッジケースを対象にしており、通常のLLMの使用例を反映していないことに注意が必要です。
しかし、ハッカーは「jailbreak-as-a-service」としてこの手法を利用し、違法行為の指示や露骨な内容など、通常は禁じられているコンテンツの生成を促すことで、企業のAIチャットボットを騙しています。
セキュリティ対策の強化と犯罪フォーラムの監視を通じて、AIを利用した最悪のシナリオに備えることが推奨されています。

出典 : Unit 42 Warns Developers of Technique That Bypasses LLM Guardrails https://www.pymnts.com/artificial-intelligence-2/2025/unit-42-warns-developers-of-technique-that-bypasses-llm-guardrails/

【このニュース記事は生成AIを利用し、世界のAI関連ニュースをキュレーションしています】

【お知らせ】
弊社ワークワンダース社主催の【無料】ウェビナーのご案内です。

ウェビナー画像

経営者/管理職のため30分でわかる「生成AIはじめの一歩」ショートセミナー【無料】


【登壇者】
安達裕哉(ワークワンダース代表取締役社長)

【日時】
2025年3月18日(火) 15:30~16:00 + 質疑応答

【募集人数】
30名

【参加費】
無料

【セミナーの内容】

1. 生成AIの利活用についての日本の現状
生成AIは世界中で可能性が模索されていますが、日本ではまだ利活用が限定的です。 日本企業は新技術の導入に対し慎重な傾向があります。

2. 何に使える?生成AI
生成AIは、新しいデータや情報を生成する能力を持っています。 企業の生産性向上に寄与する7つの主要な活用方法について解説します。

3. 生成AIの導入手続き
生成AIの導入にあたり、目的設定・課題評価・パイロットプロジェクト実施・ 社内展開・従業員教育の重要ポイントを解説します。

質疑応答
生成AIに関する疑問や不安を解消するために、参加者からの質問を受け付けます。

ご参加は以下のリンクからお申込みください。
▶ ウェビナーお申込みページはこちら