キーワード解説
RLHF(人間からのフィードバックによる強化学習)を用いた偏向情報の修正
人間がAIの出力にフィードバックを与えることで、AIが学習し、偏見や不適切な表現を修正する強化学習技術です。
0 関連記事
RLHF(人間からのフィードバックによる強化学習)を用いた偏向情報の修正とは
親クラスター「誤情報抑制技術」の解説より人間がAIの出力にフィードバックを与えることで、AIが学習し、偏見や不適切な表現を修正する強化学習技術です。
このキーワードが属するテーマ
このキーワードに紐付く記事はまだありません