Teacher Forcing

发布时间 2023-09-24 20:42:38作者: lif323

Teacher forcing 是一种在序列任务重的技术。它最初提出的动机是使得RNN的训练得以并行,加快模型训练。
简单来说Teacher forcing就是将数据集中的标签作为模型输入。
首先,以RNN为例,介绍Teacher forcing的技术细节。下图为RNN展开的计算图。

如图所示,Teacher forcing在训练时和测试时使用不同的输入。
训练时,使用数据标签作为输入;测试时使用模型的输出作为输入。

但是,在open-loop 模式下,模型在训练时和测试的输入会有较大差异。缓解该问题有如下方法:
(1) 在训练时同时输入真实的数据值(teacher forcing inputs) 和 模型生成的值。
(2) 在训练师随机选择真实的数据值和模型生成的值。

参考: Deep learning