Smiling & Weeping

　　　　　　　　　　　　　　　　---- 你已春风摇曳，我仍一身旧雪

1.GAN的基本思想

GAN全称对抗生成网络，顾名思义是生成模型的一种，而他的训练则是一种对抗博弈状态中的。下面我们举例来解释一下GAN的基本思想。

　　假如你是一名篮球运动员，你想在下次比赛中得到上场的机会。

　　于是在每一次训练赛之后你跟教练沟通：

　　你：教练，我想打篮球

　　教练：（看了看你平时篮球成绩后）...不，你不想

　　（但你并没有绝望，通过跟其他人对比，返现自己运球比较差，于是你苦练了一段时间）

　　你：教练，我想

　　教练：（没等话说完）...你，你，你想上天

　　(但你仍没有绝望，你发现大家投篮很准，于是你苦练了一段时间的投篮)

　　你：教练，我想打 lan qiu

　　教练：（教练看了看你，叹了口气）恩，想法不错，继续想别停

　　（但你仍没有绝望，你发现自己身体不够强壮，被人一碰就倒，于是你去跑健身房）

　　...

　　通过这样不断的努力和被拒绝，你终于在某一次训练赛之后得到教练的‘赞赏’，获得了　　　　“上场”的机会

　　值得一提的是在这个过程中，所有的候选球员都在不断地进步和提升。因而教练也要　　不断地通过对比场上球员和候补球员来学习分辨哪些球员是真正可以上场的，并且要“观察”得比球员更频繁。随着大家的成长教练也会会变得越来越严格。

　　现在，大家对于GAN的思想应该有了感性的认识了，下一步进一步窥探GAN的结构和思想

2.GAN浅析

2.1 GAN的基本结构

GAN的主要结构包括一个生成器G（Generator）和一个判别器D（Discriminator）

在上面的例子中的球员相当于生成器，我们需要他在球场上能有好的表现。二球员一开始都是初学者，这个时候就需要一个教练来指导他们训练，告诉他们训练的怎么样，直到真的能够达到上场的标准。而这个教练就相当于判别器。

我们现在拥有大量的手写数字的数据集，我们希望通过GAN生成一些能够以假乱真的手写数字。主要由如下两个部分组成：

1.定义一个模型来作为生成器（图中青色部分Generator），能够输入一个向量，输出手写数字大小的像素图像。

2.定义一个分类器来作为判别器（图中红色部分Discriminator）用来判断图片是真的还是假的（或者说是来自数据集中的还是声称其中的），输入为手写图片，输出为判别图片的标签。

2.2 GAN的训练方式

前面已经定义了一个生成器（Generator）来生成手写数字，一个判别器（Discriminator）来判别手写数字是否是真实的，和一些真实的手写数字数据集。那么我们怎么样来进行训练呢？

2.2.1 关于生成器

对于生成器，输入需要一个n维度向量，输出为图片像素大小的图片。因而首先我们需要得到输入的向量。

Tips: 这里的生成器可以是任意可以输出图片的模型，比如最简单的全连接神经网络，又或者是反卷积网络等。这里大家明白就好。

这里输入的向量我们将其视为携带输出的某些信息，比如说手写数字为数字几，手写的潦草程度等等。由于这里我们对于输出数字的具体信息不做要求，只要求其能够最大程度与真实手写数字相似（能骗过判别器）即可。所以我们使用随机生成的向量来作为输入即可，这里面的随机输入最好是满足常见分布比如均值分布，高斯分布等。

Tips: 假如我们后面需要获得具体的输出数字等信息的时候，我们可以对输入向量产生的输出进行分析，获取到哪些维度是用于控制数字编号等信息的即可以得到具体的输出。而在训练之前往往不会去规定它。

2.2.2 关于判别器

对于判别器不用多说，往往是常见的判别器，输入为图片，输出为图片的真伪标签。

Tips: 同理，判别器与生成器一样，可以是任意的判别器模型，比如全连接网络，或者是包含卷积的网络等等。

2.2.3 如何训练

上面进一步说明了生成器和判别器，接下来说明如何训练。

基本流程如下：

初始化判别器D的参数d 和生成器G的参数g
从真实样本中采样m个样本{x1, x2, ..., xm}, 从先验分布噪声样本{z1, z2, ..., zm}并通过生成器获取m个生成样本{x'1, x'2, ..., x'm}。固定生成器G，训练判别器D尽可能好地准确判别真实样本和生成样本，尽可能大地区分正确样本和生成的样本。
循环k次更新判别器之后，使用较小的学习率来更新一次生成器的参数，训练生成器使其尽可能较小生成样本与真实样本之间的差距，也相当于尽量使得判别器判别错误。
多次更新迭代之后，最终理想情况是使得判别器判别不出样本来自于生成器的输出还是真实的输出。亦即最终样本判别概率均为0.5.

Tips: 之所以要训练k次判别器，再训练生成器，是因为要先拥有一个好的判别器，使得能够教好地区分出真实样本和生成样本之后，才好更为准确地对生成器进行更新。更直观的理解可以参考下图：