杨丽作者

CSDN专访:吃喝玩乐背后的黑科技

大家好,我是美美,很高兴又和大家见面了,前不久,CSDN旗下AI科技大本营的杨丽记者走进美团,全面了解美团在AI领域所做的一些探索与实践。AI虽已进入开花阶段,但应用于美团这么复杂的场景,仍然任重道远。


很多人都会发现日常生活已经越来越离不开美团了,这个互联网平台涵盖了吃、住、行、游、购、娱……能帮我们做很多事情,非常接地气。黄色的美团外卖骑手,橙色的摩拜单车,还有美团和大众点评的Logo……会不时出现在各个角落,已经成为我们熟悉的城市风景线。

可这些与科技的关系,大家就不一定都那么清楚了。

我们注意到,美团点评的上市招股书中不仅多次提到科技,而且将科技放到了非常核心的位置:“我们相信科技将使人们的生活更加美好……我们用科技连接消费者和商家……通过先进的大数据人工智能技术助力服务行业。”

美团创始人王兴本人也在今年公开演讲中特别强调:“到了互联网的下半场,我们要从用户需求驱动,转向用户需求和核心技术双轮驱动。”

根据公开信息,公司产品技术研发团队现在已经超过1万人,最近一个季度的研发投入同比翻番,达到20亿元。据我们所知,这两个数字在整个业界都是排在前列的。这么大规模的研发团队,都在做什么呢?AI又在其中发挥着怎样的作用呢?

近日,带着这个问题,CSDN走访了美团AI技术团队。

美团AI全图

美团点评办公区位于朝阳区望京,具体包括几栋楼,连很多员工都搞不太清楚。从恒电大厦、科创大厦到旁边的奔驰大厦、施耐德大楼、锐创大厦,还有更远的数码港、太极大厦,都入驻了美团点评大大小小的工位、会议室,还有实验室。

“在美团做AI,有一个非常大的优势,就是数据和应用场景丰富,可以把各种各样的前沿技术用到实际产品中,改善亿万人的生活。要把几亿消费者与数百万生活服务商家高效地连接起来,AI有很多用武之地,因此比较大的业务部门中的技术团队,都有从事AI的同学。” 美团点评技术委员会算法通道主席何仁清,用下面的大图向我们介绍了整个公司AI应用的情况。

整体上,美团算法团队正在构建的AI相关技术囊括了语音、视觉、自然语言处理机器学习知识图谱等。以美团/大众点评App搜索、推荐为核心,面向外卖配送的策略、调度算法、定价系统,延伸到无人配送的自动驾驶、智能耳机里的语音识别人脸识别,再到连接用户端的客服系统,连接商家端的金融体系、供应链系统也汇聚了美团点评正在构建的庞大知识图谱……

就拿大家最熟悉的美团外卖来说,看起来非常简单,和科技好像没什么关系。但是,美团外卖一天要完成约2000万订单,而且大多集中在几小时高峰时段,及时调度50多万骑手小哥按照最优路线工作,为了保证都市上班族都能及时吃上温热而不是冰冷的饭菜,还需要将配送时间控制在30分钟内……这可不是一件容易的事情。

事实上,为了完成这一高难度的技术任务,何仁清带领的美团配送算法团队开发了目前世界上超大规模、超高复杂度的多人多点实时智能配送调度系统。“29亿次”,这是美团智能调度系统高峰时每小时的路径计算次数。

做能落地的AI,对人才求贤若渴

美团独特的AI落地场景和挑战,对优秀人才也形成了独特的吸引力。从今年整体来看,美团吸引了不少AI高手的加入,他们要么是毕业于国内外知名学府,如清华北大、CMU、UCSD等,要么是来自Google、微软、腾讯、阿里、百度等互联网巨头公司。

目前,整个公司从事人工智能的算法工程师(含实习生)已经超过1000人,可是,这还远远不能满足需求。

为了吸引AI人才,美团首次联合主办AI Challenger全球挑战赛,两个主赛道的数据集和命题设置,一个是由无人配送团队负责的“无人驾驶视觉感知”,另一个则由美团点评AI平台部NLP中心负责的“细粒度用户评论情感分析”,后者也是本次挑战赛报名最火的赛道。历时3个多月的AI Challenger全球挑战赛也于近日落下了帷幕。

组建仅两年的无人配送部门,已发展到了百人以上,甚至给出了2018年扩张至200人规模的指标,其中大部分都是AI方向。如今,新年将至,足见人才招聘的压力。

而NLP中心今年2月正式组建,不过数月,团队已超40人,主要成员均来自阿里达摩院、MSRA、腾讯(微信)、百度NLP等业界知名的AI团队。随着明年来自清华、北大、中科院、上海交大等高校的优秀博士、硕士毕业生的加入,NLP中心的团队规模还将进一步扩大。

同样求贤若渴的还有何仁清的美团配送方向的策略和算法团队。他的团队从构成上主要分两类:一类是有着过硬运筹学背景的工科人才,还有一类是有过机器学习、定价系统方面经验丰富的计算机人才。

目前在美团,算法工程师已经在排在后台、前端之后,成为第三大技术群体,而且还在迅速扩张中。

探索AI未来之无人配送

美团的算法工程师面临着一个共同的问题:在复杂多变的真实场景下,如何在快速发展的业务中利用算法提升效率效益。除此之外,以无人配送为代表的新技术探索部门还承担了更多的工作:从零到一建立系统、数据、业务。

现在,无人配送开放平台已经完成了雄安新区、首都钢铁园、深圳联想大厦等多地的测试运营,印证了美团无人配送开放平台进行片区规模化运营的可行性。

今年7月,美团还发布了无人配送开放平台,希望集合政府、高校、企业三方力量一起实现这个伟大梦想,现已吸引了包括清华大学、加州伯克利大学、北京智能车联产业创新中心、华夏幸福、Segway等近20家国内外合作伙伴的加入。

“我们已经克服了很多在技术、运营,以及装备制造、生产加工等供应链上遇到的挑战,才走到了今天。”美团点评首席科学家、无人配送部总经理夏华夏提到。

左:可在城市道路低速自动驾驶的无人配送车;右:主要用于园区内送外卖的无人车

无人驾驶技术的落地是世界难题,但美团配送末端物流“小轻慢物”的特点,则提供了一个很好的场景。从去年年底开始,原来担任美团外卖总架构师的夏华夏就开始全身心投入到无人配送这个项目上,在他看来,无人配送从技术上讲非常复杂,对各类人才的需求很大。不仅包括感知、定位、地图、规划控制等,也包括操作系统、嵌入式计算、嵌入式编程等偏内核的东西,同时还涉及硬件的集成,包括传感器、汽车底盘、车身的机械结构,也有大数据存储、云端仿真的系统。此外,在运营方面,还需要跟物业地产公司、各地政府完善无人驾驶方面的各种规章标准。

构建大规模的餐饮娱乐知识图谱——美团大脑

美团点评平台上汇聚了围绕生活服务方方面面的海量数据,比如商户信息、菜品信息、景点信息、用户评价等等。如何从这些数据中提炼出有价值的知识,从而进一步帮助人们提升生活便利性,助力餐饮娱乐产业升级呢?

今年5月,美团NLP中心开始构建大规模的餐饮娱乐知识图谱——美团大脑。美团点评作为中国最大的在线本地生活服务平台,连接了数亿用户和数百万商户,蕴含着丰富的日常生活相关知识。在建的美团大脑目前有23类概念、16亿实体、486亿三元组,对比Google的Knowledge Graph 700亿三元组和微软的Satori 500亿三元组,美团大脑的知识关联数量级可以说是世界级的了,未来一年预计会突破千亿规模。

NLP中心的核心带头人,是此前曾就职于Facebook、微软亚洲研究院的王仲远博士。作为美团大脑项目的负责人,他向我们介绍,美团大脑会充分挖掘关联各个场景数据,用AI技术让机器“阅读”用户评论,充分理解用户喜好,构建知识关联,从而形成一个“知识大脑”。相比于深度学习的“黑盒子”,知识图谱具有可解释性,在美团跨场景的多个业务中应用性非常强,目前已经在搜索、金融、商家运营等场景中验证了知识图谱的有效性。王仲远博士还谈到,深度学习知识图谱技术近年来都有很大的发展,并且存在互相融合的趋势。在美团大脑的知识构建过程中,也会使用深度学习技术进行知识挖掘,从而用知识助力业务,实现智能化的本地生活服务,帮助每个用户“Eat Better,Live Better”,这也是美团点评的企业使命。

王仲远博士同时是大众点评搜索智能中心负责人。搜索是大众点评App上用户进行信息查找的最大入口,是连接用户和信息的重要纽带。用户搜索的方式非常多样,搜索场景也非常细分和丰富,并且对接业务种类多,流量差异大,为点评搜索带来了巨大挑战。而解决这些挑战的方法,需要升级NLP技术,进行深度查询理解以及深度评价分析,并依赖知识图谱技术和深度学习技术对搜索架构进行整体升级。

据王仲远博士介绍,在NLP中心以及点评搜索智能中心两个团队的紧密合作下,短短5个月,点评搜索核心KPI在已经较高的基础上又有大幅提升,是过去一年半涨幅的五倍之多,提前七个月就完成了全年的目标。

从大方向来看,知识图谱正成为图像、自然语言处理之后又一个新的值得关注的技术领域。2018年8月Gartner公布的关于AI技术成熟度曲线显示,知识图谱自然语言生成聊天机器人等技术将逐渐得到公众的关注。

除了搜索推荐外,美团大脑正在应用于SaaS收银系统专业版。从用户角度来说,美团大脑可以阅读每一条评论,充分理解用户对商家的感受;从商家角度来说,美团大脑能够归纳总结用户评价,从而发现商家在市场上的竞争优势/劣势、用户对于商家的总体印象趋势、商家菜品的受欢迎程度变化。另外,通过细粒度用户评论全方位分析,细致刻画商家服务现状,并对商家提供前瞻性经营方向。这些智能经营建议将通过美团SaaS收银系统专业版定期触达到各个商家,智能化指导商家精准优化经营模式。

美团大脑与美团金融平台也正在紧密合作,利用知识图谱中的社区发现、标签传播等方法来对用户进行风险管理,能够更准确的识别逾期客户,以及用户的不良行为,从而大大提升信用风险管理能力。在反欺诈场景中,知识图谱已经帮助金融团队在案件调查中发现团伙欺诈案件,还可在已有的反欺诈规则上进行推理预测。

与此同时,王仲远团队也正在构建国内领先的商业化分布式图引擎系统,支撑千亿级别知识图谱的实时图查询、图推理,根据不同业务定制化支持子图加速,加速大规模分布式图计算。

目前,王仲远负责的NLP中心隶属于基础研发平台的AI平台部,而该部门由美团CTO罗道锋兼任负责人,足见美团对AI的重视。基础研发平台还在负责构建整个公司统一的云计算大数据机器学习平台,其中包括GPU集群的构建。从实际情况来看,单纯的CPU已无法满足美团日益飙升的海量数据的运算处理。9月底,机器学习平台刚刚完成了数千块GPU集群的搭建。而美团的大数据平台也已经积累了总计几百PB的海量数据。

面向业务的AI平台

如果说基础研发平台的AI平台部奠基了美团公司研发AI技术的基础实力,那么美团首席科学家张锦懋领导的美团平台算法与数据研发部就承担了另一个重要角色:连接公司内各个业务场景对于AI技术的全方位需求。

在组织架构调整后,张锦懋的团队目前划归于由美团平台、点评平台、服务体验平台部等部门组成的用户平台。实际上,从2016年起,张锦懋的团队,从组织上来讲,越来越强调构建一种面向业务AI需要的平台能力。因此,他们几乎与公司内部所有的业务部门都打过交道:“除了做业务,也要有一个技术积累的团队。我们一方面有直接深入到业务线,响应业务线相关AI需求的项目团队,另一方面也有偏向底层基础能力的团队,(算法方面)如语音、图像、NLP、机器学习、用户画像等。”

在张锦懋看来,如果美团想要形成一个在技术上有重要竞争力的平台,一定是以AI为主导,数据为基础,并做到行业最佳水平。除了配送、调度这种单点上的算法,实际上还需要一个不断迭代、演进的系统。这个系统同时也需要人和业务共同迭代,能够让业务人员与算法工程师配合起来,形成一个业务的闭环。接下来才可能突破一些关键技术点:因此,除去传统的机器学习感知层的视觉、听觉等算法方面的工作,构建以海量数据为基础,可以在业务端持续迭代演进的系统也是这个团队的关键性工作。

AI未来:长期有耐心

在美团,大家最常说的两句话,一句是“以客户为中心”,一句是“长期有耐心”。虽然外界AI很火,但美团技术团队对AI这件事有自己比较清醒的认识。

公司的业务团队离客户更近,之前其实对AI的态度并没有特别积极,因为落地确实有很多难点,而技术团队也做好了长期死磕的准备。以智能调度系统来说,虽然已经成为一种行业趋势,但何仁清还是更多看到了困难:“在推行智能化系统方面,整个公司的决心是比较大的。但是这个事情落地时候还会遇到很多问题需要解决,特别是线下的一些阻力、企业客户需要适应、利益上的变动等。”

目前,包括阿里菜鸟、京东都在试图用无人驾驶技术解决物流上的问题。相比载人车辆来讲,美团无人配送虽有着落地的优越性,但也有无人驾驶技术的复杂性,匀速20公里/时的无人配送车,在国内人流密集的大城市内行驶仍具有很高挑战性。谈及对无人配送部门未来的规划和期待时,夏华夏很冷静:“我们的预期是有的,但也没有非常严格的Deadline。希望在三五年内首先达到在无人配送场景上的落地。”

随着技术能力的不断增强,张锦懋明显感觉到今年的业务合作关系、信任度相比此前,发生了很大的改变,大家都对新技术更加重视了。当然,AI应用于美团这么复杂的场景,仍然任重道远。“如果没有一个好的平台、好的系统,这个工作的挑战是非常巨大的。现在我们还处于刚刚起步的状态。” 张锦懋在采访最后这样表示。

正如美团点评CTO罗道锋在今年AI Challenger大赛启动仪式上所分享的:

我们对AI的投入很坚决,希望依靠技术提升我们的业务,服务更多消费者和商户。不过也要看到,AI现在虽然已经进入开花阶段,但还在早期。我们目前拥有更大量的数据、更强的算力,做的是超高维空间的拟合,现在应用的AI技术还是弱人工智能,我们离强人工智能还有很远的距离,解决真实问题仍然面临不少艰巨的挑战,这是一件需要长期有耐心的事情。

美图数据技术团队
美图数据技术团队

美图拥有海量的用户数据,如何将美图的数据最大化的利用在各个场景,更大范围的发挥美图在数据上的优势,并挖掘数据无限的价值是我们的使命。

产业自动驾驶知识图谱
1
相关数据
微软亚洲研究院机构

微软亚洲研究院于1998年在北京成立,是微软公司在亚太地区设立的基础及应用研究机构,也是微软在美国本土以外规模最大的一个研究院。微软亚洲研究院从事自然用户界面,智能多媒体,大数据与知识挖掘,人工智能,云和边缘计算,计算机科学基础等领域的研究,致力于推动计算机科学前沿发展,着眼下一代革命性技术的研究,助力微软实现长远发展战略。通过与微软产品部门紧密合作,微软亚洲研究院将众多创新技术转移到了微软的核心产品中,如Office、Windows、Azure、Bing、Visual Studio、Xbox Kinect以及小冰、Cortana和Microsoft Translator等人工智能产品。

https://www.msra.cn/
微软机构

微软是美国一家跨国计算机科技公司,以研发、制造、授权和提供广泛的计算机软件服务为主。总部位于美国华盛顿州的雷德蒙德,最为著名和畅销的产品为Microsoft Windows操作系统和Microsoft Office办公室软件,以及Xbox的游戏业务。微软是美国《财富》杂志2015年评选的世界500强企业排行榜中的第95名。

https://www.microsoft.com/en-us/about
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

查询理解技术

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

调度技术

调度在计算机中是分配工作所需资源的方法。资源可以指虚拟的计算资源,如线程、进程或数据流;也可以指硬件资源,如处理器、网络连接或扩展卡。 进行调度工作的程序叫做调度器。调度器通常的实现使得所有计算资源都处于忙碌状态,允许多位用户有效地同时共享系统资源,或达到指定的服务质量。 see planning for more details

弱人工智能技术

弱人工智能(weak AI),也被称为窄AI,是专注于某一特定狭窄领域任务的人工智能。 相对于可以用来解决通用问题的强(泛)人工智能,几乎目前所有的人工智能都属于弱人工智能的范畴I。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

运筹学技术

运筹学,是一门应用数学学科,利用统计学和数学模型等方法,去寻找复杂问题中的最佳或近似最佳的解答。运筹学经常用于解决现实生活中的复杂问题,特别是改善或优化现有系统的效率。研究运筹学的基础知识包括矩阵论和离散数学,在应用方面多与仓储、物流等领域相关。因此运筹学与应用数学、工业工程专业密切相关。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

云计算技术

云计算(英语:cloud computing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备。

感知层技术

IoT (物联网) 三层结构中的一层,用于识别物体,采集信息等感知类的任务;另外两层是应用层(Application layer)和网络层(Network layer)。

操作系统技术

操作系统(英语:operating system,缩写作 OS)是管理计算机硬件与软件资源的计算机程序,同时也是计算机系统的内核与基石。操作系统需要处理如管理与配置内存、决定系统资源供需的优先次序、控制输入与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互的操作界面。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

强人工智能技术

强人工智能或通用人工智能(Strong AI或者 Artificial General Intelligence)是具备与人类同等智慧、或超越人类的人工智能,能表现正常人类所具有的所有智能行为。强人工智能是人工智能研究的主要目标之一,同时也是科幻小说和未来学家所讨论的主要议题。相对的,弱人工智能(applied AI,narrow AI,weak AI)只处理特定的问题。弱人工智能不需要具有人类完整的认知能力,甚至是完全不具有人类所拥有的感官认知能力,只要设计得看起来像有智慧就可以了。由于过去的智能程式多是弱人工智能,发现这个具有领域的局限性,人们一度觉得强人工智能是不可能的。而强人工智能也指通用人工智能(artificial general intelligence,AGI),或具备执行一般智慧行为的能力。强人工智能通常把人工智能和意识、感性、知识和自觉等人类的特征互相连结。

聊天机器人技术

聊天机器人是经由对话或文字进行交谈的计算机程序。能够模拟人类对话,通过图灵测试。 聊天机器人可用于实用的目的,如客户服务或资讯获取。有些聊天机器人会搭载自然语言处理系统,但大多简单的系统只会撷取输入的关键字,再从数据库中找寻最合适的应答句。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

自然语言生成技术

自然语言生成(NLG)是自然语言处理的一部分,从知识库或逻辑形式等等机器表述系统去生成自然语言。这种形式表述当作心理表述的模型时,心理语言学家会选用语言产出这个术语。自然语言生成系统可以说是一种将资料转换成自然语言表述的翻译器。不过产生最终语言的方法不同于编译程式,因为自然语言多样的表达。NLG出现已久,但是商业NLG技术直到最近才变得普及。自然语言生成可以视为自然语言理解的反向: 自然语言理解系统须要厘清输入句的意涵,从而产生机器表述语言;自然语言生成系统须要决定如何把概念转化成语言。

推荐文章
暂无评论
暂无评论~