キーワード解説
ユーザーフィードバックに基づく強化学習を用いた例示ランキングの動的改善
ユーザーからのフィードバックを強化学習に活用し、Few-shot例のランキングを動的に改善することで、継続的にモデル性能を高める手法を解説します。
0 関連記事
ユーザーフィードバックに基づく強化学習を用いた例示ランキングの動的改善とは
親クラスター「例示の選定基準」の解説よりユーザーからのフィードバックを強化学習に活用し、Few-shot例のランキングを動的に改善することで、継続的にモデル性能を高める手法を解説します。
このキーワードが属するテーマ
このキーワードに紐付く記事はまだありません