如何理解 RL and Control as Inference?

最近 UC Berkeley 的Sergey Levine 提出了对(深度)强化学习和控制的一种概率推断的理论解释,有没有朋友对这一方面有兴趣和了解,…
关注者
26
被浏览
2,099
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

首先这并不是Sergey Levine提的,他只是写了一个小review,review写的也一般,当然他的大部分文章都比较hacky。这些control as inference 的frameworks很早之前就有了,这些probabilistic model能更好的做control under uncertainty,并且更容易generalize到不同问题上。