生成对抗网络——GAN（代码+理解）

06-17 1622阅读

一、GAN模型介绍

二、GAN模型的训练过程

1. 初始化网络：

2. 训练判别器：

3. 训练生成器：

4. 重复步骤 2和步骤 3：

三、GAN实现

1. 模型结构

（1）生成器（Generator）

（2）判别器（Discriminator）

2. 代码

3. 运行结果展示

四、GAN模型的应用领域

五、学习中产生的疑问，及文心一言回答

1. 生成器（Generator）模型理解

2. 为什么要使用 block 函数？

3. 函数解释

4. 为什么要将像素值从[0, 255]缩放到[0.0, 1.0] ？

5. 详细解释一下是怎样对Tensor进行标准化的，以及为什么要这么做？

一、GAN模型介绍

GAN，全称 Generative Adversarial Network，即生成对抗网络，是一种基于对抗学习的深度生成模型。该模型由Ian Goodfellow在 2014年首次提出，并迅速成为学术界研究的热点，推动了生成模型领域的发展。

GAN模型主要由两部分组成：生成器（Generator）和判别器（Discriminator）。

1. 生成器：生成器模型可以是任意结构的神经网络，其输入是随机噪声（torch.randn），输出则是生成的样本。生成器的目标是使生成的样本尽可能接近真实样本的分布，以欺骗判别器。

2. 判别器：判别器模型同样可以是任意结构的神经网络，其输入是真实样本或生成器生成的样本，输出是一个概率值，表示输入样本是真实样本的概率。判别器的目标是尽可能准确地判断输入样本是真实样本还是生成样本。

这两个网络在训练过程中相互对抗、相互优化，形成了一种零和博弈。

二、GAN模型的训练过程

1. 初始化网络：

生成器（Generator）和判别器（Discriminator）的参数需要随机初始化。这两个网络都是神经网络，通常使用随机权重开始训练。

# 实例化
generator = Generator()
discriminator = Discriminator()

2. 训练判别器：

（1）从真实数据集中随机选择一批数据，将其输入到判别器中进行训练。

for i, (img, _) in enumerate(dataloader):   # 内层迭代次数为 10000 // 64 = 157次，每次 64个数据

（2）同时，从生成器的当前状态生成一批假数据（也称为生成数据），也将这些数据输入到判别器中进行训练。

# 假数据的生成
fake_img = torch.randn(size, 100)

（3）在训练判别器时，需要固定生成器的参数（.detach函数），只更新判别器的参数。

output_fake = generator(fake_img)
fake_socre = discriminator(output_fake.detach())

（4）判别器的目标是将真实数据和假数据区分开来，因此其损失函数通常定义为二元交叉熵损失函数（.BCELoss函数）。

# 损失函数
criterion = torch.nn.BCELoss()    # 对应 Sigmoid，计算二元交叉墒损失

（5）使用反向传播算法更新判别器的参数，以最小化损失函数。

3. 训练生成器：

（1）生成器的目标是生成与真实数据相似的假数据，使得判别器无法区分真实数据和假数据。

（2）生成器的损失函数通常定义为判别器对假数据的输出结果的交叉熵损失函数的相反数。换句话说，生成器希望判别器对假数据的判断结果尽可能接近真实数据。

fake_G_socre = discriminator(output_fake)
G_fake_loss = criterion(fake_G_socre, torch.ones_like(fake_G_socre))

（3）同样使用反向传播算法更新生成器的参数，以最小化其损失函数。