算法学习(二十) GAE gae算法 CSDN博客
28次收藏 发表时间:2月17日
全称是generalized advantage estimator,几乎所有最先进的policy gradient算法实现里面都使用了该技术,适合高维状态,一般都是PPO+GAE。该算法主要改进在于对A的估计。优...
CSDN博客频道
强化学习技术28 GAE 知乎
知乎专栏
六、GAE 广义优势估计 知乎
知乎专栏
没有更多结果了~
- 意见反馈
- 页面反馈