还不知道GAN?小心落伍于这个AI时代

近两年,在学术领域引起世界范围热切关注的,当属2016年AlphaGo大战李世石,以及随后AlphaGo与柯洁的人机大战。对这场围棋赛事的直播、解说、讨论热度等都丝毫不亚于今日大家对世界杯的关注。

正当人们都在惊叹AlphaGo的强大,甚至柯洁本人都感叹“AlphaGo实在太完美”的时候,人工智能的脚步却丝毫没有逗留。很快,计算机可以自己作诗、画画、甚至写乐谱了,而且写出来的诗作、画作、乐谱都被认为“挺像样的”;越来越多的“语音助手”,被用于车载导航、电脑和手机的使用;人脸识别技术几乎无所不在:机场、火车站、无人超市,甚至扩展到了猪/牛脸识别,用来判断它们是否生病等。

除了学术界的相关研究进行的如火如荼外,各大知名企业也看到了人工智能技术的蓬勃发展,纷纷投入大量人力物力巩固加强自身的人工智能技术水平。比如,FaceBook、谷歌等比以往更加频繁的出现在学术论文作者的单位列表里,并不断推出让人惊诧的新应用;BATJ纷纷成立或壮大自己的AI Lab,使自己不落伍于这人工智能的时代!

AI时代的宠儿

在琳琅满目的各类人工智能技术中,有这样一项技术,它的提出者被认为是“一个给予机器想象力的人”;这项技术被泰斗级人物Yann LeCun称为是“近 20 年来深度学习领域诞生的最酷想法”;被《麻省理工科技评论》认为是 2018 年“全球十大突破性技术”(10 Breakthrough Technologies)之一;被美国国防部高级研究计划局 (DefenseAdvanced Research Projects Agency,DARPA)资助因这项技术引发的一项竞赛.....备受关注的这项技术就是GAN:Generative Adversarial Nets,生成式对抗网络。

2014年提出的GAN,在2016年开始受到大规模关注。它一方面将产生式模型拉回到了一直由判别式模型称霸的AI竞技场,引起了学者甚至大众对产生式模型的研究兴趣,同时也将对抗训练从常规的游戏竞技领域引到了更一般领域,引起了从学术界到工业界的普遍关注。谷歌、Facebook、Twitter、苹果等众多工业界AI相关的公司也都陆续公开了许多基于GAN的相关研究成果。

那么,这项技术可以用来做什么呢?

GAN的典型应用

图1的两个视频,一个是真实视频,一个是改进后的GAN产生出的合成假视频,你能分的出真假吗?

图1      

图2中,可以将黑白图像转换为彩色图像、将航拍图像变成地图形式、将白天的照片转换为黑夜的照片、甚至可以根据物体的轮廓、边缘信息,来生成实体包包的形式;

2 GAN的部分应用示例

 图3中,可以用GAN来对人脸的某一种属性进行单独编辑和操作;

图3. GAN改进版的人脸属性编辑   

图4中列出的高清图像也都是由改进后的GAN自动生成的。这一点打破了许多人认为生成式模型GAN无法自动生成高清分辨率的图像的局限性的设想。

图4. 高清图像生成

另外,通过GAN可以实现人脸风格转换、图像去马赛克、图像风格转换等,如图5、6、 7所示。

图5. 图像风格转换  

         图6. 去马赛克

图7. 图像-艺术画风格转换

快速掌握GAN    

对于如此强大、如此重要的技术,要想实实在在的掌握它确实不易。为了帮大家更好的学习GAN,并使用GAN, 深度学习大讲堂在对GAN的发展现状与代码资源进行充分分析与评估后,推出了GAN专题专项学习。

课程将从论文阅读+代码复现两个方面来进行讲解和实战演练。一方面,在论文阅读过程中,我们将会由讲师提前总结梳理每个论文的产生背景、论文中方法的提出动机、方法核心点等几个方面进行全方位介绍;同时,另一方面,也将对代码实现过程进行手把手的讲解,包括代码的准备过程、调试训练过程中的注意事项、实现时经常会被踩的“坑”等。

每次课上所介绍的原理方法与代码实现都是一个相对独立的部分,因此,学员能更灵活的选择其中感兴趣的章节进行实现。而在整个过程中,通过原理方法与代码实践两个方面的双重引导,进而可以使用户在理论上、实际操作上都充分得了解这一技术——GAN。

入门GAN
1
相关数据
阿尔法围棋技术
AlphaGo

阿尔法围棋是于2014年开始由英国伦敦Google DeepMind公司开发的人工智能围棋程序。AlphaGo是第一个打败人类职业棋手的计算机程序,也是第一个打败围棋世界冠军的计算机程序,可以说是历史上最强的棋手。 技术上来说,AlphaGo的算法结合了机器学习(machine learning)和树搜索(tree search)技术,并使用了大量的人类、电脑的对弈来进行训练。AlphaGo使用蒙特卡洛树搜索(MCTS:Monte-Carlo Tree Search),以价值网络(value network)和策略网络(policy network)为指导,其中价值网络用于预测游戏的胜利者,策略网络用于选择下一步行动。价值网络和策略网络都是使用深度神经网络技术实现的,神经网络的输入是经过预处理的围棋面板的描述(description of Go board)。

人脸识别技术
Facial recognition

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

深度学习技术
Deep learning

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

深度学习大讲堂
深度学习大讲堂

机器之心编辑

深度学习大讲堂
深度学习大讲堂

高质量原创内容平台,邀请学术界、工业界一线专家撰稿,致力于推送人工智能与深度学习最新技术、产品和活动信息。

推荐文章
返回顶部