汤晓鸥谈深度学习三大核心要素:算法设计、高性能的计算能力以及大数据

昨日(5月20日),香港中文大学汤晓鸥教授莅临 2017CCF 青年精英大会,在会上做了题为《人工智能的明天,中国去哪》的报告。报告重点讲解了深度学习的作用,并指出深度学习的三大核心要素是算法设计、计算能力和大数据。

WX20170521-150033.png

「由于有了深度学习,我们可以把人工智能变成数据驱动的学科,数据量、参与量大到一定程度,在某件事情上机器可能超过人类。很多现实中落地的东西,其实都是深度学习做出来的。」

汤晓鸥教授认为人工智能浪潮的到来是时间的沉淀和积累,深度学习同样如此。通过关键词「深度学习」在谷歌上的搜索情况也可以略窥一二:2006年开始才有人搜索「深度学习」,因为 Hinton和Yann LeCun 发明了相关算法。2006-2011年曲线是很平稳的,只有学术界才会去搜索这个词。2011年突然之间搜索量开始呈现指数型增长,各行各业都在讨论深度学习,现在搜索量已经非常的巨大。这条曲线形象的演示了深度学习的爆发过程。

「深度学习所做的事情抽象出来比较简单,是在做从X到Y的回归、或者说从A到B的Mapping(对应)——给它一个输入,给出一个对应的输出,特殊的地方是深度学习把这件事情做得非常好。以前也有其他算法可以做,只不过一直无法超越人类,现在深度学习做到了极致。比如说给了一张人脸照片,它就可以给你对应出这个人的名字;给你一个物体的形状,它就可以告诉你是什么物体……」

WX20170521-150357.png

近年来,深度学习确实在学术界、工业界取得了重大的进展。第一个突破出现在语音识别,紧接着在视觉方面也取得了突破。

汤晓鸥认为深度学习有三个核心的要素:

  1. 学习算法的设计,设计出的“大脑”够不够聪明;

  2. 要有高性能的计算能力,可以训练一个大的网络;

  3. 必须要有大数据。

他做了个比喻,「如果把人工智能比喻一个火箭的话,大数据就是这个火箭的原料。」

随后汤晓鸥谈到了商汤科技实验室今年的一些研究进展。一个是可以对电影做实时计算分析,理解判断剧情。不仅可以把一个演员在什么地方出现、在那段时间是什么剧情找出来,还可以用自然语言进行描述,甚至自动分析整个电影的内容。应用方面,这项技术不仅可以用来分析和插播广告,还可以直接用自然语言搜索视频内容的不同片段。  

另外一项工作是超分辨率,就是把很小的图像放大,最大化还原细节。比如从视频中抓取一个很模糊的嫌疑罪犯图像,可以将它实时放大变得很清晰。这只是谍影重重电影上演的效果,还是很震撼的。

在自动驾驶方面,商汤也做了大量研究。如车辆检测、行人检测、路道线的检测、实时的场景分割等等,商汤目前可以用前端芯片进行实时处理。

最后汤晓鸥教授谈到“在中国创业的感受”,他表示,“中国创业就像跑百米一样,要跑的非常快,第一个到达终点才可以活下来。”除了要跑的快,还需要注意路上的陷阱。“这个跑道并不是塑胶跑道,而是满地都是坑的土路。这场赛跑有两个结局,一个是全力跑到最快,另外一个是刚起步就掉到坑里了。困难是一定存在的,尽管路上的坑比较多,但还是可以试一试。”

关于“用什么钱创业”汤教授也给出了相当有趣的忠告,他认为父母的钱不可以用,那是他们养老的血汗钱;自己挣的钱可以用,还年轻,钱用光了可以再去挣。投资人的钱是可以用的,因为“劫富济贫人人有责”,他鼓励大家“如果一定要创业,那就创吧”。

2017CCF青年精英大会是由中国计算机学会主办,Xtecher协办的盛会,旨在打造一年一度的中国计算机领域青年高端人才的跨界交流盛会。

理论深度学习理论汤晓鸥算法算力大数据
暂无评论
暂无评论~