キーワード解説

RLHF（人間からのフィードバックによる強化学習）を用いた偏向情報の修正

人間がAIの出力にフィードバックを与えることで、AIが学習し、偏見や不適切な表現を修正する強化学習技術です。

0 関連記事

RLHF（人間からのフィードバックによる強化学習）を用いた偏向情報の修正とは

親クラスター「誤情報抑制技術」の解説より

人間がAIの出力にフィードバックを与えることで、AIが学習し、偏見や不適切な表現を修正する強化学習技術です。

このキーワードが属するテーマ

テーマプロンプトエンジニアリング Chain-of-Thoughtなど、回答精度を高める指示設計技術クラスター誤情報抑制技術 AIの誤情報を抑制。プロンプト改善で精度向上。

このキーワードに紐付く記事はまだありません