キーワード解説

RLHF(人間のフィードバックによる強化学習)を用いたLLMの安全性向上

人間の評価をAI学習に組み込むRLHFを通じて、LLMの安全性、有用性、倫理性を高める手法について詳しく解説します。

0 関連記事