Discretizing

Discretizing Continuous Action Space for On-Policy Optimization

**发表时间：**2020（AAAI 2020） **文章要点：**作者想说，连续动作通常都假设每个维度是高斯分布的，这就限制了策略一定是一个单峰，而离散动作就没有这个约束，所以有离散的必要。然后这篇文章提出了一个把连续动作空间离散化的方法，同时避免维度爆炸。通常如果一个连续空间有$M$个维度，如果 ......

Discretizing Optimization Continuous On-Policy Action更新时间 2023-03-23

共1篇 :1/1页 首页上一页1下一页尾页

526互联

Discretizing

Discretizing Continuous Action Space for On-Policy Optimization