キーワード解説
Vertex AIでのRLHF(人間によるフィードバックからの強化学習)活用プロセス
Geminiなどの生成AIモデルの振る舞いを人間の意図に近づけるため、Vertex AI上でRLHF(人間によるフィードバックからの強化学習)を適用する具体的なプロセスとベストプラクティスを解説します。
0 関連記事
Vertex AIでのRLHF(人間によるフィードバックからの強化学習)活用プロセスとは
親クラスター「GeminiのVertex AI活用」の解説よりGeminiなどの生成AIモデルの振る舞いを人間の意図に近づけるため、Vertex AI上でRLHF(人間によるフィードバックからの強化学習)を適用する具体的なプロセスとベストプラクティスを解説します。
このキーワードが属するテーマ
このキーワードに紐付く記事はまだありません