生成对抗网络GAN论文TOP(10帮助你理解最先进技术的基础)
生成网络是深度学习中最有趣和最流行的应用之一。本文列举了10篇关于GAN的论文,将为您提供一个很好的GAN介绍,帮助您了解最先进技术的基础。
本文选择的10篇GAN论文包括:
DCGANs
训练GANs的改进技术
条件甘斯
渐进生长的gan
比根
StyleGAN
CycleGAN
Pix2Pix
斯塔克根
生成对抗网络
拉德福德等人(2015年)
建议你从这张纸DCGAN开始你的GAN之旅。本文展示了如何将卷积层用于GAN,并为此提供了一系列架构指南。本文还讨论了GAN特征的可视化、潜在空间插值、利用分类器特征进行分类器训练、评价结果等问题。这些问题都必然会出现在你的GAN研究中。
总之,DCGAN论文是一篇必读的GAN论文,因为它对架构的定义非常清晰,所以很容易从一些代码入手,开始形成开发GAN的直觉。
DCGAN模型:具有上采样卷积层的生成器架构
纸张:
深度卷积生成对抗网络的无监督表示学习
亚历克拉德福德,卢克梅斯,苏密特钦塔拉
https://arxiv.org/abs/1511.06434
改善GAN培训的技术—— Salimans等人(2016年)
这篇论文(作者包括Ian Goodfellow)根据上述DCGAN论文中列出的架构指南提供了一系列建议。本文将帮助您理解GAN不稳定性的最佳假设。此外,本文还提供了许多稳定DCGAN训练的其他机器,包括特征匹配、迷你批次识别、历史平均、单边标签平滑和虚拟批次标准化。使用这些技术构建一个简单的DCGAN实现是一个很好的练习,有助于更深入地理解GAN。
纸张:
训练GANs的改进技术
蒂姆萨利曼斯、伊恩古德菲勒、沃伊切赫扎伦巴、张维基、亚历克拉德福德、陈曦
https://arxiv.org/abs/1606.03498
有条件的GANs — Mirza和Osindero(2014年)
这是一篇好论文,读起来很流畅。GAN(有条件GAN是最先进的GAN之一。本文介绍了如何整合数据的类别标签,使GAN训练更加稳定。使用先验信息调整GAN的概念是后续GAN研究中反复出现的主题,特别是对于专注于图像到图像或文本到图像的论文。
条件GAN架构:除了随机噪声向量Z,类标签Y连在一起作为网络的输入。
纸张:
条件生成对抗网
西蒙奥辛德罗迈赫迪米尔扎
https://arxiv.org/abs/1411.1784
渐进增长的gan-Karras等人(2017年)
渐进生长GAN (PG-GAN)是一篇必读论文,因为它的惊人结果和对GAN问题的创造性方法。
本文来自NVIDIA Research,提出以渐进式成长的方式培养GAN。通过使用逐渐增加的GAN网络(称为PG-GAN)和精心处理的CelebA-HQ数据集,可以生成令人惊叹的图像。作者认为,这种方法不仅稳定了训练,而且GAN生成的图像质量也是迄今为止最好的。
它的关键思想是逐渐增加生成器和鉴别器:从低分辨率开始,随着训练的进行,增加新的层来建模越来越精细的细节。“渐进式增长”是指先训练4x4网络,再训练8x8,不断增加,最后达到1024x1024。这样既加快了训练速度,又大大稳定了训练速度,生成的图像质量非常高。
逐步增长GAN的多尺度架构,模型从44逐渐增加到10241024。
纸张:
为了提高质量、稳定性和多样性而逐步种植甘蔗
泰罗卡拉斯、蒂莫艾拉、萨穆利莱恩、亚科莱蒂宁
https://arxiv.org/abs/1710.10196
比根-布洛克等人(2019年)
BigGAN模型是基于ImageNet的图像质量最高的模型之一。模型很难在本地机器上实现,BigGAN有很多组件,比如自注意、谱归一化和带投影鉴别器的cGAN,在各自的论文中有较好的解释。然而,这篇论文很好地概述了构成目前最先进的基础论文的思想,因此非常值得一读。
BigGAN生成的图像
纸张:
用于高保真自然图像合成的大规模GAN训练
安德鲁布洛克,杰夫多纳休,卡伦西蒙扬
https://arxiv.org/abs/1809.11096
StyleGAN-Karras等人(2019年)
StyleGAN模型可以说是最先进的,尤其是潜在的空间控制。这个模型借鉴了神经风格转移中一种叫做自适应实例标准化(AdaIN)的机制来控制潜在的空间向量z,AdaIN条件在整个生成器模型中的映射和分布的结合,使得自己很难实现一个StyleGAN,但它仍然是一篇好论文,包含了许多有趣的想法。
Gan架构,允许潜在的空间控制
纸张:
一种基于风格的生成对抗网络生成器体系结构
泰罗卡拉斯、萨穆利莱恩、蒂莫艾拉
https://arxiv.org/abs/1812.04948
CycleGAN —朱等(2017)
甘的论文与之前的六篇论文不同,因为讨论的是图像到图像的转换,而不是随机向量的图像合成。Gan更具体地处理没有成对训练样本的图像到图像转换的情况。但由于周期一致性损失公式的优雅,以及如何稳定GAN训练的启示,这是一篇好论文。Gan有很多很酷的应用,比如超分辨率,风格转换,比如把马的图像变成斑马。
循环一致性损失背后的主要思想是,从法语翻译成英语,然后再翻译回法语的句子应该是与原文相同的句子。
纸张:
使用循环一致对抗网络的不成对图像到图像翻译
朱俊彦、朴泰星、菲利普伊索拉、阿列克谢埃夫罗斯
https://arxiv.org/abs/1703.10593
Pix2Pix — Isola等人(2016年)
Pix2Pix是另一种用于图像到图像转换的GAN模型。该框架使用成对的训练样本,并且在GAN模型中使用许多不同的配置。看这篇论文的时候,我觉得最有趣的部分是关于PatchGAN的讨论。PatchGAN通过观察图像的7070区域来判断它们的真假,而不是看整个图像。该模型还展示了一个有趣的U-Net风格的生成器架构,并在生成器模型中使用了ResNet风格的跳过连接。Pix2Pix有很多很酷的应用,比如把草图转换成逼真的照片。
使用成对训练样本的图像到图像转换
纸张:
基于条件对抗网络的图像到图像翻译
菲利普伊索拉,周廷辉,阿列克谢埃夫罗斯
https://arxiv.org/abs/1611.07004
StackGAN —张等(2017)
Stack的论文与这个列表中之前的论文有很大不同。它与条件性GAN和渐进生长GAN非常相似。StackGAN模型的工作原理类似于渐进式增长的GAN,因为它可以在多个规模上工作。GAN首先输出一幅分辨率为6464的图像,然后将其作为先验信息生成一幅分辨率为256256的图像。
栈是由自然语言文本生成的图像。这是通过改变文本嵌入以捕捉视觉特征来实现的。这是一篇非常有趣的文章。如果将StyleGAN中显示的潜在空格控件与StackGAN中定义的自然语言接口结合起来,肯定会非常令人惊讶。
StackGAN背后的思想是基于文本嵌入的多尺度架构
纸张:
StackGAN:利用堆叠生成式对抗网络进行文本到照片的真实感图像合成
张寒、徐涛、李洪生、张少婷、王晓刚、黄小蕾、迪米特里斯梅塔克萨斯
https://arxiv.org/abs/1612.03242
生成性对抗网络——good fellow等人(2014年)
伊恩古德费勒(Ian Goodfellow)原创的GAN论文是任何研究GAN的人的必读之作。本文定义了GAN框架并讨论了“不饱和”损失函数。文中还给出了最佳鉴别器的推导,这是近几年甘论文中常见的证明。在MNIST、TFD和CIFAR-10图像数据集上的实验也验证了GAN的有效性。
纸张:
生成对抗网络
伊恩古德菲勒、让普吉-阿巴迪、迈赫迪米尔扎、徐炳、戴维沃德-法利、谢尔吉尔奥泽尔、亚伦库维尔、约舒阿本吉奥
https://arxiv.org/abs/1406.2661
推荐阅读
- 现代循环经济要求综合考虑环境污染和经济效益。高纯氧化铁可作现代电子工业的材料,以下是以硫铁矿烧渣((硫铁矿渣用途)
- ofo小黄车锁怎么撬开,ofo小黄车新锁破解方法
- 中国移动无线路由器设置限速,移动宽带路由器限制的破解方法
- 皖2007J212外墙外保温系统构造图集(七)软件介绍(皖2007J212外墙外保温系统构造图集(七))
- 华晨金杯新海狮质量怎么样? 华晨金杯新海狮价格
- 微信账号冻结怎样解冻,微信账号冻结后怎么解冻
- 地铁上咸猪蹄,地铁或公交遇到咸猪手怎么办
- 吉安同城游戏大厅游戏介绍(吉安同城游戏大厅)
- 网络机顶盒万能通用刷机包下载卡刷,红米1S刷机教程:卡刷升级
- 2020款a6落地价多少钱? 车价大全2020款报价
- 元宵节文案怎么写 适合元宵节发朋友圈的句子(元宵节发朋友圈的句子)
- 全红婵水花几乎看不见文章,全红婵三次满分水花几乎看不见
- 银行余额图片生成,p一张银行余额图
- 淘宝淘金币是什么干嘛用的,淘宝淘金币的获取方式和使用方法
- 格力售后官网? 格力空调官网
- 磁黄铁矿的介绍(磁黄铁矿)
- 恢复出厂设置对手机有影响么,恢复出厂设置对手机有影响
- 客厅空调什么牌子好,空调什么牌子好
- 中秋节儿童故事月亮的传说?(中秋节的传说100字)