Antkillerfarm Hacking V8.0

Generative Model » GAN（五）——InfoGAN, ProGAN, GAN参考资源（1）

2019-05-04 :: 6550 Words

StarGAN（续）
InfoGAN
ProGAN
StyleGAN
BigGAN
SAGAN
S3GAN
DAGAN
FUNIT
GauGAN
GAN参考资源

StarGAN（续）

StarGAN给出的办法是：所有的Domain共享一个G网络。如上图右半部分所示。

具体的操作如下图所示：

1.D网络除了常规的Real/Fake判别器之外，还有一个Domain分类器。

2.G网络的结构和CycleGAN类似，也包括了两部分：\(G_{X\to Y}\)和\(G_{Y\to X}\)。区别在于：后者的两个G网络是不同的网络，而前者是同一个网络。

3.既然G网络只有一个，那么如何完成Domain变换呢？答案就是：把目标Domain的信息也输进G网络中。

StarGAN不仅可在同一数据集中进行Domain变换，还可在不同数据集之间进行Domain变换。上图展示的是StarGAN在CelebA和RaFD数据集上的训练过程：

1.两个数据集的标签不是完全相同的。（实际上是完全不同，囧）

2.对标签进行编码。例如图中使用的Onehot编码。

3.利用Mask区分是哪个数据集。这一步是关键。

除此之外，同期的Couple GAN也采用了类似的设计。上图是Couple GAN的网络结构图，其中的虚线表示网络的参数是共享的。

参考：

https://mp.weixin.qq.com/s/rPDvLnG4MBDRUMCWs2fjcQ

最新StarGAN对抗生成网络实现多领域图像变换

https://mp.weixin.qq.com/s/CsIKES2APuxTP33RfX81fg

升级版StarGAN来袭！你想要的多目标域多风格图像变换它都有

InfoGAN

论文：

《InfoGAN: Interpretable Representation Learning by Information Maximizing Generative Adversarial Nets》

CGAN虽然已经有了些user control的能力，然而还不够强。比如人脸图片，user control的点（例如肤色、发型、表情等）就非常多，简单的标签不足以表达这么多含义。InfoGAN主要就是用来提升user control能力的。

上图是InfoGAN的网络结构图。相比CGAN，它的改进在于：

1.将控制变量嵌入网络中。

2.Discriminator和Classifier共享大多数参数，仅最后一层不同。

参考：

https://mp.weixin.qq.com/s?__biz=MzIwMTc4ODE0Mw==&mid=2247492415&idx=1&sn=a359e72ee99555f7a2fb4e21b2ad51db

InfoGAN：一种无监督生成方法

https://zhuanlan.zhihu.com/p/140544756

InfoGAN与betaVAE

ProGAN

论文：

《Progressive Growing of GANs for Improved Quality, Stability, and Variation》

如果现在我们想生成超高分辨率的图像，譬如1024×1024图片，假设我们采用StackGAN或者是LapGAN的话，我们需要用到的 GANs结构会非常多，这样会导致网络深度巨大，训练起来非常慢。

为了解决这一问题，ProGAN（也称PGGAN）提出的想法是，我们只需要一个GANs就能产生1024×1024图片。但是一开始的时候GANs的网络非常浅，只能学习低分辨率（4x4）的图片生成，随着训练进行，我们会把GANs的网络层数逐渐加深，进而去学习更高分辨率的图片生成，最终不断的更新GANs，从而能学习到1024×1024分辨率的图片生成。

也就是说，PGGAN与StackGAN和LapGAN的最大不同在于，后两者的网络结构是固定的，但是PGGAN随着训练进行网络会不断加深，网络结构是在不断改变的。这样做最大的好处就是，PGGAN大部分的迭代都在较低分辨率下完成，训练速度比传统GANs提升了2-6倍。

当然，这也带来了另一个问题：网络结构切换的时候，Loss会发生抖动现象，论文中专门提出了如何smooth的方法，这里不再赘述。

参考：

https://mp.weixin.qq.com/s/X8osUSPROJqGVTvw0gieDQ

T2T：利用StackGAN和ProGAN从文本生成人脸

StyleGAN

StyleGAN是Nvidia Lab的Tero Karras的作品。（2018.12）

论文：

《A Style-Based Generator Architecture for Generative Adversarial Networks》

参考：

https://mp.weixin.qq.com/s/Pmr2yPZ3Mi32W5JuJCco_A

用英伟达StyleGAN生成老婆吧，他生成了一百多只明日香

https://mp.weixin.qq.com/s/i3lNcbOblgVKUTBtwKIFwg

AI秒造全球房源：StyleGAN快速生成假房子，连图说都配好了！

https://mp.weixin.qq.com/s/e1g1B-6bLe0IjNAHMJtGOw

英伟达发布最强图像生成器StyleGAN2，生成图像逼真到吓人

https://zhuanlan.zhihu.com/p/136392096

看GAN如何一步步控制图像生成风格？详解StyleGAN进化过程

https://mp.weixin.qq.com/s/cQAl7k7D6P-wG75VM_KyGw

StyleGAN2玩出新高度！从华盛顿到特朗普，无缝切换生成历届美国总统

https://mp.weixin.qq.com/s/P1cfC7smeTSBy_6LYn_HOA

看GAN如何一步步控制图像生成风格？详解StyleGAN进化过程

https://mp.weixin.qq.com/s/2G9JAWmXig0o8WR1J7dfkg

终于有人把各路StyleGAN做了个大汇总

BigGAN

论文：

《Large Scale GAN Training for High Fidelity Natural Image Synthesis》

参考：

https://mp.weixin.qq.com/s/b3EVdPGY2jxliwdbbB1kcQ

“史上最强GAN图像生成器”BigGAN的demo出了！

https://mp.weixin.qq.com/s/kSyXd5dgdEcqupDeouhObQ

BigGAN论文解读

https://mp.weixin.qq.com/s/akLvNQZMNTaVbkbUrZY4tw

史上最强图像生成器BigGAN变身DeepGAN？四倍深度实现更强效果

https://mp.weixin.qq.com/s/jglebP4Zb9rZtb2EhWiQDA

BigGAN被干了！DeepMind发布LOGAN：FID提升32%，华人一作领衔

SAGAN

论文：

《Self-Attention Generative Adversarial Networks》

S3GAN

论文：

《High-Fidelity Image Generation With Fewer Labels》

DAGAN

论文：

《Data Augmentation Generative Adversarial Networks》

这是一篇用GAN来进行数据增强的论文。

FUNIT

https://mp.weixin.qq.com/s/KupmZpMi1A46f5_NKbTU2A

深入理解风格迁移三部曲(一)–UNIT

https://mp.weixin.qq.com/s/3hv44bkXYHn2wN_2OZmhxA

四大指标超现有模型！少样本的无监督图像翻译效果逆天（FUNIT）

https://mp.weixin.qq.com/s/H0kl1i4P3Dak2COdzQNG4A

一图生万物！英伟达推超强图像转换神器，小样本一秒猫变狗（FUNIT）

https://mp.weixin.qq.com/s/isrB3yda9sGgbOb4dBXMrQ

更自由的GAN图像联想：无监督跨类的图像转换模型FUNIT，英伟达&康奈尔大学

https://mp.weixin.qq.com/s/nAaKnI1ADKfeQ8UA_VP0Fw

FUNIT

GauGAN

https://mp.weixin.qq.com/s/sTLDG0rmFZv20G5veNYS9g

英伟达再出黑魔法GauGAN：凭借几根线条，草图秒变风景照

https://mp.weixin.qq.com/s/nKME65tCeNOlY4SiPv-fWA

逼真照片随手画，马良神笔已上线–点击收获这份英伟达GauGAN开源代码

https://mp.weixin.qq.com/s/0gEmZRocv_49ngVvaa4LNg

装逼一步到位！GauGAN代码解读来了

GAN参考资源

https://mp.weixin.qq.com/s/mUOSA387465ws0l9Fp-ebQ

生成对抗网络GAN在各领域应用研究进展(中文版)，37页pdf

https://mp.weixin.qq.com/s/Gjb-PkMqUIIV81Na6Za_BQ

超全的GAN PyTorch+Keras实现集合

https://github.com/FranxYao/Deep-Generative-Models-for-Natural-Language-Processing

Deep Generative Models for Natural Language Processing

https://mp.weixin.qq.com/s/Cb3C6Q5aWSjsNFs5hqD6kw

阿里提出应用LocalizedGAN进行半监督训练

https://mp.weixin.qq.com/s/Y8D0gr1ybQ48H0bDpPvD8w

二次元萌妹高清舞姿随心变，换装只需一瞬间：又是GAN立功了

https://mp.weixin.qq.com/s/H_EcHi9BRur214rktocGbg

怎样用GAN生成各种胖吉猫？谷歌大脑程序员教你撩妹神技

https://mp.weixin.qq.com/s/FDyN6fblDFGOSNRFs5OYqA

什么都能GAN，无监督神经网络翻译新方法

https://mp.weixin.qq.com/s/DYSnAwP9xt-p0ihsEtKm1Q

TensorFlow实现StarGAN代码全部开源，1天训练完

https://mp.weixin.qq.com/s/se_2Ci4eE5fxiiG4LZrv8w

怎样用可交互对抗网络增强人类创造力

https://mp.weixin.qq.com/s/29Ror1CKFubB0n38cihMqQ

六种GAN评估指标的综合评估实验，迈向定量评估GAN的重要一步

https://mp.weixin.qq.com/s/0I8jLO3srXC3fUdoMC585w

一些fancy的GAN应用

https://mp.weixin.qq.com/s/kD_163rjGRp4rXOdIPCvRA

亲历IJCAI 2018，为什么北京大学SentiGAN能获杰出论文？

https://mp.weixin.qq.com/s/v23rSjIKyVEAGCN8rEtsfg

伯克利新论文：合成GAN（Compositional GAN）

https://mp.weixin.qq.com/s/ddR7dwwBZnu3knKmfDWjCg

斯坦福大学PH.D Aditya Grover：115页Slides带你领略深度生成模型（Deep Generative Model）全貌

https://mp.weixin.qq.com/s/QjEShm__Rq0n7n_sdc6GNg

Ryan P.Adams教授：深度概率生成模型—156页普林斯顿教程带你回顾深度生成模型最新发展脉络

https://mp.weixin.qq.com/s/DSHuCNQWKN3pLozZ8i16hQ

卡成PPT不开心？GAN也能生成流畅的连续表情了

https://mp.weixin.qq.com/s/5S6TsyT6dwXP3cTE_KQleg

把酱油瓶放进菜篮子：UC Berkeley提出高度逼真的物体组合网络Compositional GAN

https://mp.weixin.qq.com/s/IE5h6AiAYhA1nBvsFiGUHA

GAN最新进展：8大技巧提高稳定性

https://mp.weixin.qq.com/s/QacQCrjh3KmrQSMp-G_rEg

贝叶斯生成对抗网络

https://mp.weixin.qq.com/s/c84LMFnIhoDeolc1B4MIVA

AI以假乱真怎么办？TequilaGAN教你轻松辨真伪

https://mp.weixin.qq.com/s/fgL6FtjeF-EgG5jjAGDR7A

GANimation让图片秒变GIF表情包，秒杀StarGAN

https://mp.weixin.qq.com/s/yShYrMFKox30jXajXXQPGw

如何让GAN生成更高质量图像？斯坦福大学给你答案

https://mp.weixin.qq.com/s/qiLFQowjH67XECXBlppUDg

对抗深度学习:鱼(模型准确性)与熊掌(模型鲁棒性)能否兼得？

https://mp.weixin.qq.com/s/1SpHGtjkSfDEFCZuudCm0Q

基于GAN和VAE的跨模态图像生成

https://mp.weixin.qq.com/s/02amaVnLFxeLDBsjG-iN1Q

UBC&腾讯AI Lab提出首个模块化GAN架构，搞定任意图像PS组合

https://mp.weixin.qq.com/s/pf0fNSoNDaI9bZvohRX28A

不再使用人眼评估，你训练的GAN还OK吗？

https://mp.weixin.qq.com/s/KeXXi5kwvWAfArv13f6VPg

给Cycle-GAN加上时间约束，CMU等提出新型视频转换方法Recycle-GAN

https://mp.weixin.qq.com/s/IzVTkH7fEiS4gAUIyA_IrA

谷歌GAN 实验室来了！迄今最强可视化工具，在浏览器运行GAN

https://mp.weixin.qq.com/s/1jBpz55pPgM8oxlUZLSWXA

ICML2018对抗生成网络论文评述

https://mp.weixin.qq.com/s/uQpmP7pJ8wnEgyJrvvHgwg

基于解剖结构的面部表情生成

https://mp.weixin.qq.com/s/cLCtxS1frJYvC5tLsQAWrQ

用神经网络生成音乐

https://mp.weixin.qq.com/s?__biz=MzIwOTc2MTUyMg==&mid=2247485368&idx=1&sn=1da8bd2490fa2fe16dbe25aea79dcd63

交互式GAN Lab让生成对抗网络轻松实现可视化！

https://mp.weixin.qq.com/s?__biz=MzIwMTc4ODE0Mw==&mid=2247491630&idx=1&sn=394ffec2969cff23f63022526684f259

杜伦大学提出GANomaly：无需负例样本实现异常检测

https://mp.weixin.qq.com/s/BEuA5icaQwRJGsJJLnAFVg

用机器学习生成图片：GAN的局限性以及如何GAN的更爽

您的打赏，是对我的鼓励

Generative Model » GAN（五）——InfoGAN, ProGAN, GAN参考资源（1）

StarGAN（续）

InfoGAN

ProGAN

StyleGAN

BigGAN

SAGAN

S3GAN

DAGAN

FUNIT

GauGAN

GAN参考资源

Recent Posts in Generative Model

Recent Posts in All Blogs