キーワード解説
強化学習のサンプル効率を改善する状態空間モデルベースのプランニング手法
強化学習エージェントが効率的に学習するために、状態空間モデルを用いて将来の状態を予測し、より少ない試行回数で最適な行動ポリシーを見つけるプランニング手法を詳述します。
0 関連記事
強化学習のサンプル効率を改善する状態空間モデルベースのプランニング手法とは
親クラスター「状態空間モデル」の解説より強化学習エージェントが効率的に学習するために、状態空間モデルを用いて将来の状態を予測し、より少ない試行回数で最適な行動ポリシーを見つけるプランニング手法を詳述します。
このキーワードが属するテーマ
このキーワードに紐付く記事はまだありません