「忘却」と防御の進化:AIの新たなセキュリティ対策

2024.09.04

WorkWonders

人間と同じように、AIにも不要な情報を”忘れる”ことが大切です。これに着目し、不要なデータを削除する「Unlearning」技術が注目されていますが、この技術には限界があることが最近の研究で指摘されています。
特定の知識を忘れさせる一方で、重要な情報まで失ってしまったり、”忘れた”はずの情報が再度出現してしまうことが問題となっています。
更に、AIを欺く「敵対的攻撃」という問題に対する新たな防御方法として、自己評価を用いたシンプルなアプローチが提案されており、意外な形で安全性を高めることが可能です。
このようにUnlearningやAIのセキュリティを向上させる取り組みは、まだ完全ではありませんが、新たな技術の開発により、私たちのデジタル環境はより安全でスマートなものになりつつあります。

出典 : 生成AI/LLM技術最新トレンド|①モデルから知識を”忘却”する技術Unlearningとその限界 ②敵対的攻撃を劇的に減少させるシンプルなアプローチ https://www.brainpad.co.jp/doors/contents/generative_ai_llm_news_trend_11/

【このニュース記事は生成AIを利用し、世界のAI関連ニュースをキュレーションしています】

ワークワンダースからのお知らせ

生成AIの最新動向をメルマガ【AI Insights】から配信しております。ぜひご登録ください