キーワード解説
TRPOによる二足歩行ロボットの歩行学習における学習安定化手法
方策勾配法の学習安定化手法であるTRPOが、複雑な二足歩行ロボットの歩行パターン学習において、いかに効果的に機能するかを説明します。
0 関連記事
TRPOによる二足歩行ロボットの歩行学習における学習安定化手法とは
親クラスター「方策勾配法」の解説より方策勾配法の学習安定化手法であるTRPOが、複雑な二足歩行ロボットの歩行パターン学習において、いかに効果的に機能するかを説明します。
このキーワードが属するテーマ
このキーワードに紐付く記事はまだありません