Bootstrapped

Deep Exploration via Bootstrapped DQN

郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！ NIPS 2016 Abstract 有效的探索仍然是强化学习（RL）的主要挑战。常见的探索抖动策略，如ε-贪婪，不进行时间扩展（或深度）探索；这可能导致数据需求呈指数级增长。然而，在复杂的环境中，大多数用于统计有效RL的算法在计算上是不 ......

Bootstrapped Exploration Deep DQN via更新时间 2023-09-25

共1篇 :1/1页 首页上一页1下一页尾页

526互联

Bootstrapped

Deep Exploration via Bootstrapped DQN