キーワード解説

深層強化学習における報酬関数設計の自動化による二足歩行学習の効率化

AIが最適な二足歩行を学習するための「報酬関数」を、人間が手動で設定する手間を減らし、自動化する技術に焦点を当てます。

0 関連記事