Predictron

The Predictron: End-To-End Learning and Planning

**发表时间:**2017(ICML 2017) **文章要点:**这篇文章设计了一个叫Predictron的结构,在abstract的状态上进行学习,通过multiple planning depths来使得model self-consistent,进行端对端的学习。这里的设定是MRP,不是MD ......
Predictron End-To-End End Learning Planning
共1篇  :1/1页 首页上一页1下一页尾页