旷视科技唐文斌:人工智能将在制造和物流行业集中爆发

2018年12月12日,以“改革开放 行稳致远”为主题的2018央视财经论坛暨中国上市公司峰会在北京举行。北京旷视科技有限公司联合创始人兼CTO唐文斌,受邀出席活动,参加人工智能·智时代启未来”分会场的圆桌讨论,与中国工程院院士倪光南、中国工程院院士邬贺铨、蚂蚁金服集团副总裁AI首席科学家漆远,以及前海梧桐并购基金董事长谢闻栗共话人工智能时代的过去、现在、与未来,探讨如何激发人工智能在各行业中的新动能作用。

来源:央视财经论坛

AI让摄像头苏醒

随着人工智能技术进一步深入发展,越来越多的创新应用应运而生,正在悄无声息地改变人们生活方式。在“人工智能·智时代启未来”现场,“刷脸”支付、“刷眼”筛查疾病、人脸识别与检索等黑科技集体亮相科技展区。日前刷爆世界互联网大会的“旷视天眼”也在此得以亮相。基于国际领先的人脸识别和视觉感知技术,旷视天眼不仅能识别人脸,读取年龄、性别等个人的基本外在属性,还能够分析行人的发型、穿戴特征,这引起了现场观众们的极大兴趣。

论坛现场,旷视科技联合创始人兼CTO唐文斌向大家详细介绍了“旷视天眼”。“我们希望让摄像头成为帮助机器看懂世界的眼睛。因为我们看到无论是在城市里,还是重点场所的公共区间里,虽然有很多的摄像头,但这些摄像头都没有被真正的用起来,而人工智能可以赋予摄像头挖掘物理世界中深度数据的能力,并将这些大数据运用起来提升整个社会和经济的效率。”

唐文斌打了个比方,“利用摄像头和人工智能视觉技术结合,我们可以识别分析出现场观众里面中有多少人正在玩手机,而这些观众的行为特征侧面反映了台上嘉宾演讲是否足够吸引人。”此外,通过摄像机在公共领域的应用,人工智能可以帮助家人快速寻找走失的孩子或老人。而在零售的场景中,智能感知设备可以帮助商家获取传统零售场景中无法获取到的消费者大数据,如年龄分布、性别分布、热销商品等,从而帮助商家持续优化经营策略,让商家多卖钱、让消费者能够更快速地找到自己想要的商品。“所以旷视人工智能产品核心是希望让所有的摄像头拥有‘一个大脑’,能够发掘更丰富的数据、看懂里面蕴藏的信息,并且产生价值。无论是这个会场的场景,还是零售的场景,乃至整个城市的场景都会变得更加地智能。

然而人工智能的视觉认知能力目前发展到了什么程度?如果是善于伪装的犯罪分子能不能逃脱智能摄像头的“慧眼”?唐文斌介绍,现在整个人脸识别技术不管是对于年龄的识别还是身份的识别,其实已经做到比较准的状态了,即使犯罪嫌疑人做出简单的伪装或者微整形,问题不大,算法都可以比较精准的识别出来。

当然这些场景只是一个方面的应用。不仅是安防场景,在更多的应用层面,“旷视天眼”可以将检测置于事件之前实现预判。“比如一个火车站,可能一个人一个月来了20次,而且这个人并不是工作人员,那通常情况下很少会有人去火车站这么多次,这就是异常现象,当然未必就一定有问题,也许这个人是一个几乎每天要往返两地的旅客,但也许是一个潜在的扒手,所以这个情况是值得管理部门去查一查的。一旦我们赋予了传统设备这样的分析能力,像此类异常、跟踪等情况都可以提前预测,让很多不好的事情在发生之前就可以去进行干预,能够让我们社会变得更加的安全。”

不过,在对传统行业的升级中,如何用好人工智能技术、如何保护个体数据隐私、如何确立行业应用标准,仍是整个AI产业共同面临的问题,而这些问题需要国家相关部门带头,联手民营科技企业与终端用户联手克服,在人工智能革命的热潮之下,政策、技术、法制、应用多方协同才能促进AI产业健康发展。

人工智能发展核心 

在今年初央视联合腾讯发布的《中国经济生活大调查》显示,超九成受访者认为人工智能会对自己的工作生活产生影响。毋庸置疑的是,人工智能已经发展到非常关键的阶段。而对于当下这个阶段人工智能的具体发展情况,与会的各位专家学者也给出了自己的解读。

如果从国际角度对比,中西方的人工智能发展仍有一些差异。人工智能在中国确实很热,华人学者发表的人工智能论文数量可以说远超美国,但是高质量的论文却远远落后于美国甚至一些国家。表明我们比较关注目前人工智能的应用方面,然而在人工智能基础研究上面,我们是后来者,还处于学习阶段。”邬贺铨院士表示,中国人工智能目前有很好的发展势头,从技术,从应用上中国有非常好的市场,我们现在城市的管理迫切需要人工智能,企业转型也需要人工智能,我们从事人工智能研究的人数应该说也是相当多的。“但是我们在核心技术上面还是有差距。”

对此,倪光南院士建议,要发展人工智能基础研究和算法,一方面要将产品继续推进人工智能的应用发展,推进产学研深度融合,另一方面,更需要注意原创性、创新性的提升。作为中国具有代表性的人工智能前沿科技企业,旷视始终坚持用原创技术推动基础研究和产业应用的本质创新。唐文斌透露,此前盛极一时的阿尔法元(AlphaGo Zero)中其实就用到了旷视首席科学家孙剑主导的“深度残差网络 (ResNet)”模型,使阿尔法元能够快速、准确地学习每一子的落子概率和对整个棋局进行判断,通过自学习以100:0的成绩击败阿尔法狗。唐文斌打趣道:“所以向两位院士汇报一下,中国还是有在积极地做基础研究的企业。”

来源:央视财经论坛

人工智能的未来发展是否能战胜人类,这一问题一直是学界和业界关注的焦点。对此,唐文斌给出的答案是“会”,他认为:“因为世界是物质的,所以人类的大脑运作机制必然是有一定的规律在里面,这个规律可能是量子的,或者可能不是我们现在所能理解的规律,但我想最终我们一定会把这个问题搞明白。在基于一定规律情况下,我认为人的大脑是可被模拟的,所以未来的机器是有可能具备人的能力甚至超越人的能力的。”

那么谁是人工智能的大脑?会上,技术人员出身唐文斌选择了算法、数据和计算能力这三个选项。他表示,现在的人工智能核心在于基于深度学习,基于大数据训练方式下产生的人工智能。所以在现在这个阶段,算法、数据和计算能力是重要的。因为一个算法设计的好不好,一个神经网络设计的好不好决定了算法的精准度到底有多高。而算法的训练是以数据为基础的,“你有多少可训练的数据,就是让它见多少世面,从见的世面决定它走到多远。”

在唐文斌看来,人工智能还处于非常初期的阶段。未来人工智能的核心将不局限于这三项,"其他技术"的发展或将决定人工智能发展。结合前面“人脑可被模拟”的结论,未来或许主导人工智能的是量子计算,甚至是我们还未知的新的技术。“人和机器相比,人是一种特别经济的主体,人只要吃几碗饭就可以做很多的事情,但机器现在跑一个算法是需要花很大的电能,人吃下去的这几碗饭不能转化成这么大的电能,所以人——是一个输入和输出整个转化率是非常高的机体,但是机器现在远远达不到,因此我相信未来会存在新的技术会进一步使得机器整个能功性耗比大幅下降,我们现在看的芯片只是万里长征的第一步,未来其他技术会有非常多的可能性。”唐文斌补充。

人工智能的下一步? 

未来哪些行业集中爆发人工智能?智能驾驶、智能医疗、智能零售、智能家居、智能机器人、智能安防,亦或其他?现场唐文斌给出了比较严谨的回答,他认为在近几年相对短的时间内,技术“爆发”有两个条件:一是行业面临"强需求",二是能够匹配这些需求的技术已经准备好了。“我比较看重人工智能在零售、安防这两个场景的应用,以及与机器人的结合应用,比如制造和物流场景。机器人本身不是场景,而是和人工智能一样,是能够进一步改造和优化场景、提升效率的一种手段或工具”。

他进一步介绍,“劳动密集的制造和物流行业尤其具备爆发的条件。在这种场景我们目前侧重三种算法的突破,一种是感知算法,一种是决策算法,还有一种是优化算法。因为靠感知和决策我们现在可以做单体智能,比如机械臂、单体机器人的运行,但是在制造和物流场景,仅有感知和决策是不够的,需要通过群体优化的方式把大规模机械臂、大规模搬运机器人进行整体的优化,才能去实现全场景的改造。今天恰逢双十二,旷视此刻有超过500台机器人正在天津的天猫超市中为消费者们拣货搬货,相比以前一千多人在零下十几度的天气里走30多公里的局面,人机协作的方式让整个仓工作的效率变得更高,我切实看到了人工智能技术给这个场景带来的突破性的改变,所以我认为人工智能在这样的场景中能够更快速的爆发。”

旷视科技
旷视科技

Power Human with AI

产业智能制造唐文斌旷视科技深度神经网络人脸识别
1
相关数据
孙剑人物

孙剑,男,前微软亚研院首席研究员,现任北京旷视科技有限公司(Face++)首席科学家、旷视研究院院长 。自2002年以来在CVPR, ICCV, SIGGRAPH, PAMI等顶级学术会议和期刊上发表学术论文100余篇,两次获得CVPR最佳论文奖(2009, 2016)。孙剑博士带领的团队于2015年获得图像识别国际大赛五项冠军 (ImageNet分类,检测和定位,MS COCO 检测和分割) ,其团队开发出来的“深度残差网络”和“基于区域的快速物体检测”技术已经被广泛应用在学术和工业界。

深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

深度残差网络技术

残差网络是为了解决深度神经网络(DNN)隐藏层过多时的网络退化问题而提出。退化(degradation)问题是指:当网络隐藏层变多时,网络的准确度达到饱和然后急剧退化,而且这个退化不是由于过拟合引起的。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

推荐文章
暂无评论
暂无评论~