526互联

Efficient Off-Policy Meta-Reinforcement Learning via Probabilistic Context Variables

发布时间 2023-09-19 15:27:21作者: 穷酸秀才大草包

郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！

Proceedings of the 36th International Conference on Machine Learning, PMLR 97:5331-5340, 2019

Meta-Reinforcement

meta-reinforcement reinforcement probabilistic

meta-reinforcement

meta-reinforcement reinforcement exploration

reinforcement minimization experience off-policy

reinforcement exploration off-policy learning

probabilistic efficient framework embraces

memory-efficient consolidation reinforcement

off-policy alphazero targets greedy