算法学习(二十) GAE gae算法 CSDN博客
28次收藏 发表时间:2月17日
全称是generalized advantage estimator,几乎所有最先进的policy gradient算法实现里面都使用了该技术,适合高维状态,一般都是PPO+GAE。该算法主要改进在于对A的估计。优...
CSDN博客频道
菜鸟玩GAE(Google App Engine)完全指南 知识库 博客园
kb.cnblogs.com
没有更多结果了~
- 意见反馈
- 页面反馈