キーワード解説
報酬が疎なタスクにおける好奇心駆動型方策勾配法の活用メカニズム
報酬がなかなか得られない「報酬が疎な」環境で、好奇心駆動型方策勾配法がどのようにエージェントの探索を促し、学習を効率化するかを解説します。
0 関連記事
報酬が疎なタスクにおける好奇心駆動型方策勾配法の活用メカニズムとは
親クラスター「方策勾配法」の解説より報酬がなかなか得られない「報酬が疎な」環境で、好奇心駆動型方策勾配法がどのようにエージェントの探索を促し、学習を効率化するかを解説します。
このキーワードが属するテーマ
このキーワードに紐付く記事はまだありません