艾巴生活网

您现在的位置是:主页>科技 >内容

科技

生成对抗网络GAN论文TOP(10帮助你理解最先进技术的基础)

2024-04-25 21:19:53科技帅气的蚂蚁
生成网络是深度学习中最有趣和最流行的应用之一。本文列举了10篇关于GAN的论文,将为您提供一个很好的GAN介绍,帮助您了解最先进技术的基础

生成对抗网络GAN论文TOP(10帮助你理解最先进技术的基础)

生成网络是深度学习中最有趣和最流行的应用之一。本文列举了10篇关于GAN的论文,将为您提供一个很好的GAN介绍,帮助您了解最先进技术的基础。

本文选择的10篇GAN论文包括:

DCGANs

训练GANs的改进技术

条件甘斯

渐进生长的gan

比根

StyleGAN

CycleGAN

Pix2Pix

斯塔克根

生成对抗网络

拉德福德等人(2015年)

建议你从这张纸DCGAN开始你的GAN之旅。本文展示了如何将卷积层用于GAN,并为此提供了一系列架构指南。本文还讨论了GAN特征的可视化、潜在空间插值、利用分类器特征进行分类器训练、评价结果等问题。这些问题都必然会出现在你的GAN研究中。

总之,DCGAN论文是一篇必读的GAN论文,因为它对架构的定义非常清晰,所以很容易从一些代码入手,开始形成开发GAN的直觉。

DCGAN模型:具有上采样卷积层的生成器架构

纸张:

深度卷积生成对抗网络的无监督表示学习

亚历克拉德福德,卢克梅斯,苏密特钦塔拉

https://arxiv.org/abs/1511.06434

改善GAN培训的技术—— Salimans等人(2016年)

这篇论文(作者包括Ian Goodfellow)根据上述DCGAN论文中列出的架构指南提供了一系列建议。本文将帮助您理解GAN不稳定性的最佳假设。此外,本文还提供了许多稳定DCGAN训练的其他机器,包括特征匹配、迷你批次识别、历史平均、单边标签平滑和虚拟批次标准化。使用这些技术构建一个简单的DCGAN实现是一个很好的练习,有助于更深入地理解GAN。

纸张:

训练GANs的改进技术

蒂姆萨利曼斯、伊恩古德菲勒、沃伊切赫扎伦巴、张维基、亚历克拉德福德、陈曦

https://arxiv.org/abs/1606.03498

有条件的GANs — Mirza和Osindero(2014年)

这是一篇好论文,读起来很流畅。GAN(有条件GAN是最先进的GAN之一。本文介绍了如何整合数据的类别标签,使GAN训练更加稳定。使用先验信息调整GAN的概念是后续GAN研究中反复出现的主题,特别是对于专注于图像到图像或文本到图像的论文。

条件GAN架构:除了随机噪声向量Z,类标签Y连在一起作为网络的输入。

纸张:

条件生成对抗网

西蒙奥辛德罗迈赫迪米尔扎

https://arxiv.org/abs/1411.1784

渐进增长的gan-Karras等人(2017年)

渐进生长GAN (PG-GAN)是一篇必读论文,因为它的惊人结果和对GAN问题的创造性方法。

本文来自NVIDIA Research,提出以渐进式成长的方式培养GAN。通过使用逐渐增加的GAN网络(称为PG-GAN)和精心处理的CelebA-HQ数据集,可以生成令人惊叹的图像。作者认为,这种方法不仅稳定了训练,而且GAN生成的图像质量也是迄今为止最好的。

它的关键思想是逐渐增加生成器和鉴别器:从低分辨率开始,随着训练的进行,增加新的层来建模越来越精细的细节。“渐进式增长”是指先训练4x4网络,再训练8x8,不断增加,最后达到1024x1024。这样既加快了训练速度,又大大稳定了训练速度,生成的图像质量非常高。

逐步增长GAN的多尺度架构,模型从44逐渐增加到10241024。

纸张:

为了提高质量、稳定性和多样性而逐步种植甘蔗

泰罗卡拉斯、蒂莫艾拉、萨穆利莱恩、亚科莱蒂宁

https://arxiv.org/abs/1710.10196

比根-布洛克等人(2019年)

BigGAN模型是基于ImageNet的图像质量最高的模型之一。模型很难在本地机器上实现,BigGAN有很多组件,比如自注意、谱归一化和带投影鉴别器的cGAN,在各自的论文中有较好的解释。然而,这篇论文很好地概述了构成目前最先进的基础论文的思想,因此非常值得一读。

BigGAN生成的图像

纸张:

用于高保真自然图像合成的大规模GAN训练

安德鲁布洛克,杰夫多纳休,卡伦西蒙扬

https://arxiv.org/abs/1809.11096

StyleGAN-Karras等人(2019年)

StyleGAN模型可以说是最先进的,尤其是潜在的空间控制。这个模型借鉴了神经风格转移中一种叫做自适应实例标准化(AdaIN)的机制来控制潜在的空间向量z,AdaIN条件在整个生成器模型中的映射和分布的结合,使得自己很难实现一个StyleGAN,但它仍然是一篇好论文,包含了许多有趣的想法。

Gan架构,允许潜在的空间控制

纸张:

一种基于风格的生成对抗网络生成器体系结构

泰罗卡拉斯、萨穆利莱恩、蒂莫艾拉

https://arxiv.org/abs/1812.04948

CycleGAN —朱等(2017)

甘的论文与之前的六篇论文不同,因为讨论的是图像到图像的转换,而不是随机向量的图像合成。Gan更具体地处理没有成对训练样本的图像到图像转换的情况。但由于周期一致性损失公式的优雅,以及如何稳定GAN训练的启示,这是一篇好论文。Gan有很多很酷的应用,比如超分辨率,风格转换,比如把马的图像变成斑马。

循环一致性损失背后的主要思想是,从法语翻译成英语,然后再翻译回法语的句子应该是与原文相同的句子。

纸张:

使用循环一致对抗网络的不成对图像到图像翻译

朱俊彦、朴泰星、菲利普伊索拉、阿列克谢埃夫罗斯

https://arxiv.org/abs/1703.10593

Pix2Pix — Isola等人(2016年)

Pix2Pix是另一种用于图像到图像转换的GAN模型。该框架使用成对的训练样本,并且在GAN模型中使用许多不同的配置。看这篇论文的时候,我觉得最有趣的部分是关于PatchGAN的讨论。PatchGAN通过观察图像的7070区域来判断它们的真假,而不是看整个图像。该模型还展示了一个有趣的U-Net风格的生成器架构,并在生成器模型中使用了ResNet风格的跳过连接。Pix2Pix有很多很酷的应用,比如把草图转换成逼真的照片。

使用成对训练样本的图像到图像转换

纸张:

基于条件对抗网络的图像到图像翻译

菲利普伊索拉,周廷辉,阿列克谢埃夫罗斯

https://arxiv.org/abs/1611.07004

StackGAN —张等(2017)

Stack的论文与这个列表中之前的论文有很大不同。它与条件性GAN和渐进生长GAN非常相似。StackGAN模型的工作原理类似于渐进式增长的GAN,因为它可以在多个规模上工作。GAN首先输出一幅分辨率为6464的图像,然后将其作为先验信息生成一幅分辨率为256256的图像。

栈是由自然语言文本生成的图像。这是通过改变文本嵌入以捕捉视觉特征来实现的。这是一篇非常有趣的文章。如果将StyleGAN中显示的潜在空格控件与StackGAN中定义的自然语言接口结合起来,肯定会非常令人惊讶。

StackGAN背后的思想是基于文本嵌入的多尺度架构

纸张:

StackGAN:利用堆叠生成式对抗网络进行文本到照片的真实感图像合成

张寒、徐涛、李洪生、张少婷、王晓刚、黄小蕾、迪米特里斯梅塔克萨斯

https://arxiv.org/abs/1612.03242

生成性对抗网络——good fellow等人(2014年)

伊恩古德费勒(Ian Goodfellow)原创的GAN论文是任何研究GAN的人的必读之作。本文定义了GAN框架并讨论了“不饱和”损失函数。文中还给出了最佳鉴别器的推导,这是近几年甘论文中常见的证明。在MNIST、TFD和CIFAR-10图像数据集上的实验也验证了GAN的有效性。

纸张:

生成对抗网络

伊恩古德菲勒、让普吉-阿巴迪、迈赫迪米尔扎、徐炳、戴维沃德-法利、谢尔吉尔奥泽尔、亚伦库维尔、约舒阿本吉奥

https://arxiv.org/abs/1406.2661