キーワード解説

自然方策勾配法(Natural Policy Gradient)による複雑シミュレーションの高速化

方策の更新方向をより効率的に決定する自然方策勾配法が、複雑なシミュレーション環境における学習をいかに高速化するかを説明します。

0 関連記事