キーワード解説
危機感を煽るプロンプトがAIの安全性フィルタに与える脆弱性(レッドチーミング)評価
AIに「危機感」を煽るプロンプトが、AIの安全性フィルタをどのように迂回し、潜在的な脆弱性を生み出すか、レッドチーミングの観点から評価します。
0 関連記事
危機感を煽るプロンプトがAIの安全性フィルタに与える脆弱性(レッドチーミング)評価とは
親クラスター「心理的刺激」の解説よりAIに「危機感」を煽るプロンプトが、AIの安全性フィルタをどのように迂回し、潜在的な脆弱性を生み出すか、レッドチーミングの観点から評価します。
このキーワードが属するテーマ
このキーワードに紐付く記事はまだありません