キーワード解説

RLHF(人間からのフィードバックによる強化学習)を用いた偏向情報の修正

人間がAIの出力にフィードバックを与えることで、AIが学習し、偏見や不適切な表現を修正する強化学習技術です。

0 関連記事