サイバーセキュリティ会社Wizは、コード内の秘密情報を検出するために小規模な言語モデル「Llama 3.2 1B」を微調整し、従来の正規表現に基づく方法を大きく上回る86%の精度と82%の再現率を達成しました。このモデルは標準的なCPUハードウェア上でも実行できる効率性を持ち、大規模な言語モデルの計算コストやプライバシーに関する懸念を解決します。
Wizでは、顧客のプロプライエタリなコードを外部サービスに共有すること無く、企業規模でスキャンを行い、真に効果的なセキュリティ対策を可能にしました。
さらに、リアルタイム性が要求される分野で利用できるよう、モデルのインフラチェックを実施し、最適化を行った結果、ファイル処理の推定時間をわずか10秒以内に短縮。
Wizのリサーチは、AIがサイバーセキュリティの課題にどのように応えることができるかの重要な教訓を提供しており、特定のセキュリティニーズに合わせてカスタマイズされた効率的なソリューションの開発が可能であることを示しています。
出典 : Fine-Tuning a Small Language Model for Secrets Detection | Wiz Blog https://www.wiz.io/blog/small-language-model-for-secrets-detection-in-code