キーワード解説
特化型AIエージェントによるLLMの自動レッドチーミング(擬似攻撃)
AIエージェント自身がLLMに対して悪意あるプロンプトや攻撃をシミュレートし、システムの脆弱性を自動的に発見・評価する手法です。
0 関連記事
特化型AIエージェントによるLLMの自動レッドチーミング(擬似攻撃)とは
親クラスター「セキュリティと安全性」の解説よりAIエージェント自身がLLMに対して悪意あるプロンプトや攻撃をシミュレートし、システムの脆弱性を自動的に発見・評価する手法です。
このキーワードが属するテーマ
このキーワードに紐付く記事はまだありません