526互联
首页
Ai
Java
Python
Android
Mysql
JavaScript
Html
CSS
Explanation-Aware
APRIL 2022-Explanation-Aware Experience Replay in Rule-Dense Environments
#I. INTRODUCTION 解释是人类智能的关键机制,这种机制有可能提高RL代理在复杂环境中的表现 实现这一目标的一个核心设计挑战是将解释集成到计算表示中。即使在最小的规则集变化下,将规则集(或部分规则集)编码到智能体的观察空间等方法也可能导致严重的重新训练开销,因为规则的语义被明确地作为输入 ......
Explanation-Aware
Environments
Explanation
Experience
Rule-Dense
更新时间 2023-05-17
共1篇 :1/1页
首页
上一页
1
下一页
尾页