Rule-Dense

APRIL 2022-Explanation-Aware Experience Replay in Rule-Dense Environments

#I. INTRODUCTION 解释是人类智能的关键机制，这种机制有可能提高RL代理在复杂环境中的表现实现这一目标的一个核心设计挑战是将解释集成到计算表示中。即使在最小的规则集变化下，将规则集(或部分规则集)编码到智能体的观察空间等方法也可能导致严重的重新训练开销，因为规则的语义被明确地作为输入 ......

Explanation-Aware Environments Explanation Experience Rule-Dense更新时间 2023-05-17

共1篇 :1/1页 首页上一页1下一页尾页

526互联

Rule-Dense

APRIL 2022-Explanation-Aware Experience Replay in Rule-Dense Environments