キーワード解説

TRPOによる二足歩行ロボットの歩行学習における学習安定化手法

方策勾配法の学習安定化手法であるTRPOが、複雑な二足歩行ロボットの歩行パターン学習において、いかに効果的に機能するかを説明します。

0 関連記事