state-action

用 Gaussian Process 建模 state-action 空间相关性,加速 Multi-Fidelity RL

基于 14 年的 MFRL 论文,利用相邻 state-action 的空间相关性来加速学习,用 gaussian processes 建模 env dynamics(model-based)/ Q function(model-free),得到了两种跟 14 年 MFRL 很相似的算法 。 ......
共1篇  :1/1页 首页上一页1下一页尾页