生成对抗模仿学习(GAIL)

发布时间 2023-10-07 11:25:08作者: emanlee

生成对抗模仿学习(GAIL)

生成对抗模仿学习(Generative Adversarial Imitation Learning,GAIL)、序列生成对抗网络(Sequence Generative Adversarial Networks,SeqGAN)都是强化学习与GAN的结合,传统强化学习方法往往缺乏了专家信息的指导,GAN的引入替代了原有人工设置的奖励函数,并且在其处理离散数据的问题上有了新的启发,主要应用在无人系统的智能决策和自然语言处理相关的问题中。时空预测生成对抗网络(LSTM Generative Adversarial Networks,GAN-LSTM)提出了使用RNN捕获时序数据的相关性特征,是GAN在应用方向上的一种扩展,主要用于处理无人系统中具有时序特征的数据。可解释生成对抗网络(Interpretable Generative Adversarial Networks,Interpretable GAN)是最新的研究成果之一,着重解决的是GAN的可解释性问题,在无人系统技术的各个方面具备一定的应用潜力。图2汇总了近年来GAN的重要衍生模型及其特点。

 

https://roll.sohu.com/a/659666106_358040