キーワード解説

報酬が疎なタスクにおける好奇心駆動型方策勾配法の活用メカニズム

報酬がなかなか得られない「報酬が疎な」環境で、好奇心駆動型方策勾配法がどのようにエージェントの探索を促し、学習を効率化するかを解説します。

0 関連記事