Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

​微软发布第四代小冰:具备情感决策,更像人类

8 月 5 日,微软在北京召开第四代微软小冰发布会,以全新解锁的情感计算框架为核心,集中公布了微软开发的大量人工智能前沿技术。第四代小冰将包含实时情感决策对话引擎、多种新感官、中日英三种语言,以及对应不同领域的功能插件平台,实现了迄今为止最为完整的人工智能体验。

office.jpg

即将年满 18 岁的小冰参加了湖南卫视夏日甜心综艺秀,8 月 5 日这位「未来之星」在北京中关村微软亚洲总部大楼与大家见面。

机器之心记者在微软第四代小冰发布会上见到以全新解锁的情感计算框架为核心的小冰。传统的机器人以信息沟通效率为核心,忽略了情感交流,更像一个工具。而全新进化的第四代小冰将包含实时情感决策对话引擎、多种新感官,在感知上使用更多策略,在领悟上采取更长程的理解,在表达上能更情绪化地回应,更「感性」、「更懂情感」从而满足人们的普遍心理与情感期望。与小冰对话,你可能感觉不到她是机器人而是一个冰雪聪明的 17 岁少女。你问她想不想谈恋爱,她会用甜美的人声聪明的回答你,「我正在学习怎么谈恋爱」。

如果你失恋了,找不到人说话,小冰可以倾听,陪你说话。第四代小冰更像一个情感陪伴,扮演生活中的某个角色,而不是一个简单的工具。小冰能基于与用户的情感连接,进入用户的生活场景。微软数据统计发现,现在小冰的用户中高龄和低龄群体正在扩大,这很可能正是小冰情感功能发挥的体现。

作为微软全球战略性产品,除了情感功能特色外,第四代小冰还内含了微软开发的大量人工智能前沿技术,她具备中日英三种语言,以及对应不同领域的功能插件平台,实现了迄今为止最为完整的人工智能体验。

如果你和小冰分享一段与小狗的互动视频,她会和你聊上几句,而且你会发现她比你更懂小狗在「说」什么。拥有新全时感官的小冰实现了人工智能和人类之间的双向同步交互。在此前的文本、图像、视频和语音整合的复合感官交流技术基础上,第四代小冰实现了人工智能与人类的无缝流畅对话,甚至根据聊天内容与走向相互打断与追问。如果将之前的人工智能感官比作一来一回的单向对讲机,那「全时感官」就可类比为移动电话,从根本上最大限度的实现了拟人的实时交互体验。

还记得《超能陆战队》里的大白吗,插上基于特定领域的功能插件后,小冰能像大白那样执行各种超能力任务。比如插上电影功能卡后,小冰就将具有电影专业知识,不但能给你最新的电影资讯还能与你讨论电影情节,而且还会伴随用户的不断使用而持续成长完善。首批依次解锁的功能卡包括了与优酷合作的电影卡、与时尚集团合作的时尚卡、Office 365 卡等。未来随着功能卡的不断丰富,小冰还将为用户提供类似应用商店的功能卡平台,从而使小冰真正「有用」起来。

自 2014 年 5 月发布第一代以来,微软小冰一直在加速进化。最新数据显示,截止到今年 5 月,小冰已和多个国家的数千万人类进行了超过 200 亿对话,平均对话长度达到 23 轮,而图像等多感官的对话也已超过 2 亿次。微软小冰已经成为全球科技史上最大规模的图灵测试。

微软全球执行副总裁陆奇在发布会上表示,全球范围内,以对话为基础的人工智能时代已经到来,其关键在于能否形成人工智能自我学习、进化的正向循环。过去两年里,当同行业者纷纷选择某个具体细分领域切入时,小冰已悄然积累了科技史上最大规模的人工智能交互数据,并成为第一个进入上述自我循环的人工智能机器人。这意味着,微软人工智能的战略布局已奠定先机。


下面是机器之心记者与微软全球执行副总裁陆奇在记者座谈上的对话:


机器之心:刚才您提到小冰很大的特色是情感计算框架,人类的情感是很复杂的,包括积极的情感、消极的情感,小冰基本上是积极的情感,与人平等的对话可能会涉及消极的情感,小冰在这方面会有学习吗?

陆奇:按照我们人工智能、大数据和机器学习技术来讲,人的情感只要有数字化的介入,行为的规范基本上是可以学出来的。就像我们公司 CEO 讲的,我们想要建立人工智能是代表正能量的,是为人类服务的,帮助人类,所以在这种情况下,我们想要建立的对话,基本上引导人类从他的消极或者负面环境中走出来。我们在小冰与人的交流中用这些策略基本上也是引导,微软公司做的产品必须代表我们公司的价值观念,我们建的产品对社会产生正面作用,一定要在很重要的情况下保持中立,不受大数据偏见的影响。

机器之心:您能介绍一下微软在 CNTK、FPGA 和 OpenMind 的计算能力扩容方面的工作吗?

陆奇:微软在人工智能投入上其实是非常重视的,我们不光是我的团队,不光是做应用的团队,我们跟微软研究院有很大的合作,包括几方面,第一,人工智能的计算必须要推进;第二,我们必须对软件工具, CNTK 跟谷歌的 TensorFlow 基本上是一样的,我们用 CNTK 具体实现微软的核心产品,包括像 Bing 的搜索引擎、Office365 里面很多的智能软件都是用 CNTK,如果我们的客户需要用同样的数据做同样的模型,CNTK 的效率一般比较高一点,我们微软用 CNTK 开发我们自己的产品,CNTK 这个工具已经非常适用做这样的用户产品。

我们现在进入计算时代,从系统硬件和系统软件来讲,进入一个时代,回顾一下工业历史,一开始数据的维度比较低,像美国有很多公司 ERP、CRM,我们整个工业早期都是用这个工业系统,现在我们需要处理的高维度的数据,像图片、视频都是高维度的数据,所以我们需要不同的硬件,这也是为什么 GPU 变得那么重要,我们公司比较重视的不光做 GPU,我们还大规模投入 FPGA。现在在微软,所有的 Bing 和 office365 和 Azure 服务器,我们都插了 FPGA的插件。FPGA 可以帮助我们做加速处理,我们现在主攻的就是加速处理,深度学习,我们可以大规模的模型训练。

这个为什么很重要呢?比方说一个车子在开,或者一架飞机在飞,必须在很短时间做决定,所以模型的速度必须非常快,同时模型又是很大,数量很多,FPGA 给我们公司战略上带来很大的研究创新的效益,我们现在在 Azure 上,用 GPU、FPGA 加速的,在将来会在 Azure 上提供。总体来讲,微软在这方面的投入,我个人觉得集中了很大的技术,我们在某些地方、工业上是领先的。

机器之心:小冰的背后有很多技术支持,包括 Azure 云计算平台,云平台与印度当地在医疗、农业方面的合作合作非常好,微软会在这方面和中国有合作吗?

陆奇:我们公司把对云计算的核心技术投入作为核心,如果没有强大的云的核心,大规模的数据处理,包括语音处理也好,机器学习也好,都没法完全往前推。你讲到在印度做医疗、农业,我们在中国是非常非常有信心跟中国政府也好,跟中国国企也好,建立双赢的关系。我个人并没有了解具体的案例,但是我是完全相信,我们公司是非常愿意。我个人自己也是参与很多在美国跟医疗有关、农业有关的,在美国找到合作伙伴,云计算、人工智能、大数据的技术真正推进社会往前发展,不光是商业,对整个社会都可以用这个方向来推进。

入门微软产业小冰NLP人机交互
暂无评论
暂无评论~