Rule-Dense

APRIL 2022-Explanation-Aware Experience Replay in Rule-Dense Environments

#I. INTRODUCTION 解释是人类智能的关键机制,这种机制有可能提高RL代理在复杂环境中的表现 实现这一目标的一个核心设计挑战是将解释集成到计算表示中。即使在最小的规则集变化下,将规则集(或部分规则集)编码到智能体的观察空间等方法也可能导致严重的重新训练开销,因为规则的语义被明确地作为输入 ......
共1篇  :1/1页 首页上一页1下一页尾页