キーワード解説

特化型AIエージェントによるLLMの自動レッドチーミング(擬似攻撃)

AIエージェント自身がLLMに対して悪意あるプロンプトや攻撃をシミュレートし、システムの脆弱性を自動的に発見・評価する手法です。

0 関連記事