526互联
首页
Ai
Java
Python
Android
Mysql
JavaScript
Html
CSS
Discretizing
Discretizing Continuous Action Space for On-Policy Optimization
**发表时间:**2020(AAAI 2020) **文章要点:**作者想说,连续动作通常都假设每个维度是高斯分布的,这就限制了策略一定是一个单峰,而离散动作就没有这个约束,所以有离散的必要。然后这篇文章提出了一个把连续动作空间离散化的方法,同时避免维度爆炸。通常如果一个连续空间有$M$个维度,如果 ......
Discretizing
Optimization
Continuous
On-Policy
Action
更新时间 2023-03-23
共1篇 :1/1页
首页
上一页
1
下一页
尾页