キーワード解説
AIの安全性向上:DPO(直接選好最適化)を用いたLlamaモデルの倫理的調整
DPOといった強化学習手法を用いて、Llamaモデルの応答を倫理的かつ安全なものに調整し、AIの安全性向上を図る方法を解説します。
0 関連記事
AIの安全性向上:DPO(直接選好最適化)を用いたLlamaモデルの倫理的調整とは
親クラスター「Llamaのファインチューニング」の解説よりDPOといった強化学習手法を用いて、Llamaモデルの応答を倫理的かつ安全なものに調整し、AIの安全性向上を図る方法を解説します。
このキーワードが属するテーマ
このキーワードに紐付く記事はまだありません