キーワード解説

Q学習におけるAIベースの報酬関数自動設計(Reward Shaping)手法

強化学習の重要な要素である報酬関数をAIが自動で設計するReward Shaping技術により、学習効率を向上させる手法を解説します。

0 関連記事