AMiner学术头条
20-01-02 17:43 微博认证:北京智谱华章科技有限公司AMiner项目官方微博

【生成对抗网络三十年发展梳理】(重要进展如下图所示)

GAN最近几年发展非常快,这也是Yoshua Bengio获得图灵奖的贡献之一。

传统的生成模型是要预测联合概率分布P(x, y)。首先玻尔兹曼机(RBM)这个模型其实是一个基于能量的模型,1986年的时候就有。

Hinton在2006年的时候重新拿出来作为一个生成模型,并且将其堆叠成为Deep Belief Network,使用逐层贪婪或者wake-sleep的方法训练。

AutoEncoder也是上个世纪80年代Hinton就提出的模型,此时由于计算能力的进步也重新登上舞台。Bengio等人又搞了Denoise AutoEncoder。Max welling等人使用神经网络训练一个有一层隐变量的图模型,由于使用了变分推断,并且最后长得跟AutoEncoder有点像,被称为Variational AutoEncoder。此模型中可以通过隐变量的分布采样,经过后面的decoder网络直接生成样本。

在生成模型方面,最近一个最重要的进展就是对抗生成网络(GAN),可以说是现在最火的生成模型。2014年Ian Goodfellow在NIPS上发表了最初的GAN文章,到现在已经有近九千引用。

为什么这个模型引起如此大的关注呢?一个原因是这个模型理论上非常优雅,大家理解起来简单方便;二就是效果确实好。看上面这一排,是基于GAN的一些应用文章,下面这些是改进GAN的训练的一些文章。这些文章都引起了广泛关注。

可以看出,GAN的发明人Ian Goodfellow是少年得志的典范。他本科在斯坦福,硕士在Andrew Ng手下,博士就跑到蒙特利尔 Yoshua Bengio 手下了。他另外还有一个导师Aaron Courville。大家现在经常用的教科书《Deep Learning》,作者就是Ian Goodfellow和他两个博士导师。他是85年人,发表GAN在2014年,29,还差一年才30。GAN这个工作也给Goodfellow带来了很多荣誉,比如17年就被MIT under 35选中了。Goodfellow博士毕业后去了Google Brain,后来又跳到Open AI,又跳回Google,现在在苹果做特别项目机器学习项目负责人,实际上现在他也才34岁。另外,GAN是Ian Goodfellow在蒙特利尔的时候的工作。大家知道今年图灵奖给了深度学习三巨头,其中的Bengio,在图灵奖官网上给获奖理由,选的三个贡献之一就是GAN。另外两个贡献分别是90年代的序列概率模型和00年代的语言模型。GAN可以说是Bengio的代表作之一了,甚至可以说帮助他拿图灵奖。

另外还有几个有名的GAN的扩展,包括:cycleGAN和vid2vid。去年NIPS企业展示会场,英伟达把vid2vid配合方向盘,做了个实物demo,非常引人关注。
(来源:AMiner 2019人工智能发展报告http://t.cn/AiFU2F3l)