キーワード解説

危機感を煽るプロンプトがAIの安全性フィルタに与える脆弱性(レッドチーミング)評価

AIに「危機感」を煽るプロンプトが、AIの安全性フィルタをどのように迂回し、潜在的な脆弱性を生み出すか、レッドチーミングの観点から評価します。

0 関連記事

危機感を煽るプロンプトがAIの安全性フィルタに与える脆弱性(レッドチーミング)評価とは

親クラスター「心理的刺激」の解説より

AIに「危機感」を煽るプロンプトが、AIの安全性フィルタをどのように迂回し、潜在的な脆弱性を生み出すか、レッドチーミングの観点から評価します。

このキーワードが属するテーマ

このキーワードに紐付く記事はまだありません