孙茜茜作者

京东数科JDD-2018全球总决赛2支冠军队伍诞生,50万奖金+京东数科offer均被学生党收入囊中

1 月 13 日,JDD-2018 京东数字科技全球探索者大赛全球总决赛落下帷幕。

JDD 大赛总决赛选手与导师、评委合影

本届 JDD 大赛设置了「人口动态普查与预测」、「自动驾驶地图优化与传感器融合」两道赛题,中国内地、中国香港、美国和以色列四大赛区。

自 2018 年 11 月 20 日大赛启动报名以后,在不到一个月的报名时间里,共吸引了 2100 余支队伍、3000 多名选手报名参加。参赛选手中,有的自发在知乎上撰写攻略,为其他参赛者提供参赛建议和引导;有的则在开源社区公开自己的源代码,只为寻得高手切磋。

在选拔赛阶段,四大赛区独立排名比赛,由计算机直接给出算法得分,最终按排名顺序选出各个赛区的赛题冠军。最终,四大赛区两道赛题共 8 支队伍(均来自全球各高校的本科生、硕士生、博士生)于 1 月 12 日、13 日齐聚位于北京的京东集团总部参加全球总决赛。他们不仅要在 24 小时内完成总决赛赛题的数据和算法研发,还要在导师指导下完成商业计划书,并进行商业路演,由评委综合评定。

谈及 JDD 大赛,京东集团副总裁、京东数字科技首席数据科学家郑宇表示:「整个 JDD 大赛是一个连接场景、数据、人工智能、商业模式的平台,与京东数科做产业数字化活动的战略定位一脉相承。」

2018 年 11 月 20 日,京东数字科技 CEO 陈生强在 JDD-2018 京东数字科技全球探索者大会上宣布,「京东金融」品牌正式升级为「京东数字科技」(JD Digits),布局金融、城市、农牧、营销等产业数字化。

郑宇还表示,以前学生都专注在算法、精度、调节参数方面,对算法和技术的应用没有太多思考,「不太利于产学研一体化,也不太利于学生毕业之后真正在实践中解决一些问题。所以我们针对的模式是不太一样的,提供了一个从一开始有算法想法,到真正把算法商业化落地的平台,这是一个很好的贡献。」

为了帮助参赛选手实现技术能力与商业应用的深度结合,更好地提升他们的理论与实战经验,主办方为选手们请来了两位导师。郑宇担任「人口动态普查与预测」赛题的导师,京东集团副总裁、X 事业部总裁肖军担任「自动驾驶地图优化与传感器融合」赛题的导师。

此外,主办方还邀请了清华大学计算机科学与技术系副教授唐杰、IDG 资本合伙人牛奎光、创世伙伴资本创始主管合伙人周炜,驭势科技创始人兼 CEO 吴甘沙、联通大数据有限公司总经理赵越、TalkingData 创始人兼首席执行官崔晓波作为路演评委,为每支团队进行点评和商业指导。

最终,来自以色列赛区的团队 Cheese&Chips 最终夺得「人口动态普查与预测」赛题的全球总冠军,来自中国内地赛区的团队 wh 最终夺得「自动驾驶地图优化与传感器融合」赛题的全球总冠军。

大赛从启动到落幕,共耗时近两个月时间。这两支冠军队伍均是第一次参加这么长时间的比赛、均是同门师兄弟/妹、均是第一次制作商业计划书。

他们都将获得 50 万元的冠军奖金,并受邀加入京东数字科技。

三名 ML&AI 博士将冠军收入囊中

「还没想好怎么用这个奖金,先买一台新电脑吧。」Cheese&Chips 团队成员陈逸舟在发表获奖感言时如是说,博得满场笑声笑语。

Cheese&Chips 团队中,陈逸舟和代忠祥均是博士二年级学生,队长于海斌是博士五年级学生,团队三人均就读于新加坡国立大学计算机学院,在同一个老师门下攻读博士学位,研究机器学习人工智能

他们的赛题是人口动态普查与预测,「我们一直认为处理数据是一个核心。」总决赛中,出于对数据的「极致处理」,他们的算法取得了 100 分的成绩。

陈逸舟在总决赛中负责算法,他说,「观察比赛的数据,其实是有很大波动的。它会突然在一定时间上去。持续一段时间后又会下来,会有一个突发性的方形信号的起伏,我们就把它进行特殊处理,把它去掉,然后就能得到一个平滑的预测值,效果会好一些。」

夺冠后,三人均表示,「没想到会取得这么好的成绩。」初赛成绩起起伏伏,进复赛也比较勉强(一个赛区共五名,他们排名第四)。进了复赛后,成绩一直领先。参加复赛的四五天时间,陈逸舟和于海斌每天写代码调参数,「假设一个人每天清醒的时间可能是 16 个小时,我们可能 10 个小时放在这上面。」

「人口动态普查与预测」赛题全球总冠军 Cheese&Chips(左起:郑宇、代忠祥、于海斌、陈逸舟)

他们的商业计划书是通过人口流动预测帮助租车公司调度车辆安排。

汽车租赁有一个很重要的指标——汽车的使用率,对于租车公司的营收有非常重大的影响。因此,他们想通过在本次大赛所用到的精确时空预测模型,对跨城市人口流量进行预测,提供准确的信息,帮助租车公司优化车辆调度,增加租车需求地和车辆位置的一致性,从而帮助租车公司增加利润。

路演完毕后,郑宇评价道:「我很希望这样的应用能够在中国落地。因为租车确实是一个痛点。」

赛后,谈及这个 idea 的诞生,陈逸舟说,「因为我们队长今天刚好要租车,所以昨天他就忽然想到要租车。因为都是交通,人口流动数据跟交通的其他数据是有性质上的相似性的,所以可以用来辅助提高车的使用率。」

「商业计划书是最大的挑战。之前根本不知道商业计划书是什么,更不用提它需要什么东西了。」代忠祥在总决赛中负责商业计划书的制作,他表示,「郑总的指导还是非常有用的,他告诉我们的商业计划书应该是什么样子,帮我们理清了思路。」

导师郑宇对 Cheese&Chips 队进行赛题指导

「第二次沟通的时候,我们有一些备选(idea)。他给我们画了一个范围,我们知道应该往哪方面去思考,我们要站在什么样的角度考虑什么样的受众,然后具体到细节。」陈逸舟回忆道,「比如,人口流动是一个时空性质的数据。用其他城市数据(比如污水排放相应的数据),我们的算法是否也能够有好的表现。他告诉我们不一定可以,因为我们要考虑数据之间的相关性,这两个数据类型不同,模型可能没法泛化那么远。然后我们就知道哪些方向不行。」

肖军:「团队阵容非常豪华,两款产品也非常有前景」

「考完试直接提箱子来北京,60 个小时只睡了 6 个小时,居然精神贼好,讲 PPT 的时候非常放松,差点在台上说脱口秀。可能这就是我的熬夜潜力吧,从未被开发过的潜力。」夺冠后,wh 队的葛雯斐发了这样一条朋友圈。

发表获奖感言时,她十分耿直地说,「我来参加这个比赛,就是抱两个师兄大腿的,我是硕士,他俩是博士。」

葛雯斐目前是武汉大学导航控制与制导方向的硕士研究生,她口中的师兄是常乐——正攻读大地测量学与测量工程专业博士(二年级)、刘天弋——正攻读通信与信息系统专业博士(一年级)。师兄妹三人均是武汉大学组合导航学科带头人牛小骥教授的弟子,牛小骥教授长期从事惯性导航和 GNSS/INS 组合导航研究。此次比赛就像为他们「量身定制」一般。

「我们初赛是从截止日期前两周开始的。」队长常乐表示,之所以参加此次比赛是因为导师的推荐,「导师发个链接给我,说比赛跟你现在的研究方向比较接近,你把相关的数据算一下。算了一下,提交结果,感觉还不错,就继续一步步参加。」

自动驾驶地图优化与传感器融合」赛题全球总冠军 wh (左起:肖军、刘天弋、常乐、葛雯雯)

「激光环境感知与组合导航系统——GLINS」是他们在路演现场推出的产品。

自动驾驶是一个庞大的系统工程,里面包含了多种技术成分,包括定位、决策、控制、人工智能、建图、通讯、信息安全等。这些技术是复杂的、非线性的、多维的融合。」葛雯斐在台上向大家介绍,「只有定位和地图做好了,自动驾驶才能拥有导航功能。我们团队在定位和建图方面有独特的技术优势,结合研究背景和自动驾驶的需求,我们推出了一款激光环境感知与组合导航系统——GLINS。」

这个产品包含两部分,「多传感器融合建图软件」和「车载实时导航终端」。

「多传感器融合建图软件」采用了激光雷达数据、GPS、IMU(惯性测量单元)以及里程计数据进行高精度的点云制作,关键技术是全局 SLAM 技术和动态物体剔除技术。根据现场的显示图可以看到,修正后的地图精度更高、噪声更小。

自动驾驶中常用的传感器有 GPS、雷达、里程计、INS(惯性导航系统,简称惯导)等,但这些传感器可能会在某种情况下变的质量不好甚至失效,因此,采取合理的策略对这些传感器进行组合是非常重要的。

葛雯斐介绍,「惯导的完整建模以及车辆运动模型的建立,使得我们的定位系统能够在复杂的环境中,都提供一个连续的可靠的应用结果。面对城市中的高楼环境,我们的定位结果能够达到分米级的位置以及 0.1 度的航向误差。」

「我们的核心是对惯导模型的完整建立以及车载变数信息的考量。这个比赛中,为了验证我们的方案,由于比赛提供的数据质量比较好,我们就加了 30 秒的激光雷达中断,同时禁用了 GPS,只用了惯导的数据以及车载约束信息进行位姿的解算。通过约束信息,预测轨迹在约束后精度较约束前有了十倍的提升,这也验证了我们所提出的方案的有效性。」

据他们分析,之所以分数比其他组优秀,主要是对惯导数据的应用。比赛提供的惯导数据质量不好,其他组都舍弃掉了。

他们的成绩一直比较稳。虽然在总决赛现场,「眼睁睁」看着另一组的成绩慢慢逼近,但他们最终没有再对模型进行任何调整,除了时间紧迫、提交次数有限,主要还是因为成绩比较「稳」。

他们表示,能够夺冠,导师肖军也给了很大的帮助。赛前,肖军给他们勾勒了自动驾驶大的框架,帮忙他们理清了自动驾驶目前的痛点以及创业公司经常陷入的误区,并告诉他们自动驾驶是一个特别大的工程,不是某一个技术点突破的事情,但是可以选择在一个点上进行突破。「如果你的定位算法或者是你的激光、RBG 融合方法是最好的,那就去做一个整体的激光和视觉融合的模块。」

导师肖军对所有团队进行赛题指导

他们根据导师的指导,紧紧扣题,最终获得导师认可。「这两个产品是非常有前景的,这个团队阵容也非常豪华。这两个产品是我非常支持的、大学生或者技术团队创业的一种方式。技术团队创业,不需要去打造一种新型的商业模式。通过自己的技术,在几个大类的产品上面,技术方面做得比行业足够强,就已经打造了一个非常好的商业模式,所以这一组的商业模式我觉得非常不错。」

当主持人打趣「我感觉肖总马上就要把你们招到门下了」,肖军脸上乐开了花。

关于本届 JDD 大赛,郑宇还表示,「在全球产业数字化转型浪潮下,我们更愿意做产业升级的「共建者」。京东数科希望通过 JDD 大赛这个桥梁,挖掘越来越多对企业数字化转型、对城市数字化转型、对产业数字化能够做出贡献的技术人才,将数字科技和产业的『行业 Know-how』形成深度结合,探索数字科技的无限可能性,实现各方的共生共建,最终推动全球数字科技的发展。」

产业京东比赛自动驾驶京东数科
1
相关数据
京东金融机构

京东金融集团于2013年10月开始独立运营,至今已建立起十大业务板块——企业金融、消费金融、财富管理、支付、众筹众创、保险、证券、农村金融、金融科技、海外事业,实现了公司金融和消费者金融的双重布局,并实现了国际化。截至目前,京东金融累计为800万线上线下商户,3.6亿个人用户提供支付和金融服务。京东金融目前是在全球范围内为白领、中产阶级提供金融服务最多的科技公司,也是覆盖中国农村范围最广,服务农民数量最多的金融科技公司,是全球金融科技领域增速最快的公司之一。京东金融集团依托京东体系内数亿用户以及数十万合作伙伴所积累的电商数据、金融数据以及各类第三方数据,利用人工智能、生物识别、云计算、区块链等新兴科技,开发出风险量化模型体系、精准营销模型体系、智能投顾模型体系以及用户洞察模型体系等诸多前沿应用模型体系,并应用于金融场景之中。其中,京东金融风控体系利用深度学习、图计算、生物探针等人工智能技术,已实现无人工审核授信和放款,逾期率和资损水平低于行业平均值50%以上。此外,京东金融还实现了智能风控能力的输出,帮助银行在信贷审核上效率提高10倍以上,客单成本降低70%以上。京东金融频频获得国际学术界的肯定。包括,企业金融服务能力享誉全球,是目前唯一荣获《经济学人》旗下欧洲金融颁发的“全球卓越司库奖”的中资企业。信贷风控荣获《亚洲银行家》信贷风控技术实施奖,是中国区唯一获得此奖项的科技公司。智能风控实验室利用RNN循环神经网络算法进行用户行为路径学习,反欺诈准确率超过目前市场平均水平3倍以上,该算法发表在世界顶级机器学习学术会议之一PKDD2017上,成为世界级的科研成果。

唐杰人物

唐杰是清华大学计算机系副教授。他以学术社交网络搜索系统Arnetminer而闻名,该系统于2006年3月推出,目前已吸引来自220个国家的2,766,356次独立IP访问。他的研究兴趣包括社交网络和数据挖掘。

自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

激光雷达技术

自动驾驶车辆传感器的一种,采用激光扫描和测距来建立车辆周围环境的详细三维模型。Lidar 图像具有高度准确性,这使得它可以与摄像头、超声波探测器和雷达等常规传感器相提并论。然而激光传感器面临体积过大的问题,同时,它的机械结构非常复杂。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

调度技术

调度在计算机中是分配工作所需资源的方法。资源可以指虚拟的计算资源,如线程、进程或数据流;也可以指硬件资源,如处理器、网络连接或扩展卡。 进行调度工作的程序叫做调度器。调度器通常的实现使得所有计算资源都处于忙碌状态,允许多位用户有效地同时共享系统资源,或达到指定的服务质量。 see planning for more details

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

数据科学技术

数据科学,又称资料科学,是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。

导数技术

导数(Derivative)是微积分中的重要基础概念。当函数y=f(x)的自变量x在一点x_0上产生一个增量Δx时,函数输出值的增量Δy与自变量增量Δx的比值在Δx趋于0时的极限a如果存在,a即为在x0处的导数,记作f'(x_0) 或 df(x_0)/dx。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

京东机构

京东(股票代码:JD),中国自营式电商企业,创始人刘强东担任京东集团董事局主席兼首席执行官。旗下设有京东商城、京东金融、拍拍网、京东智能、O2O及海外事业部等。2013年正式获得虚拟运营商牌照。2014年5月在美国纳斯达克证券交易所正式挂牌上市。 2016年6月与沃尔玛达成深度战略合作,1号店并入京东。

知乎机构

知乎作为中文互联网知名知识内容平台,致力于构建一个人人都可接入的知识分享网络,让人们便捷地与世界分享知识、经验和见解,高效获得可信赖的解答。 目前,知乎已经覆盖「问答」社区、一站式知识服务平台「知乎大学」、短内容分享功能「想法」等一系列产品和服务,并建立了包括音频、视频在内的多元媒介形式。截止 2018 年 8 月底,知乎用户数已突破 2 亿,回答数超过 1.2 亿。未来,知乎进一步加大对 AI 技术和应用的投入,构建一个由 AI 驱动的智能社区,让知识普惠每一个人。

https://www.zhihu.com
京东数科机构

京东数字科技的前身是京东金融。2018年11月,京东金融品牌升级为京东数字科技,旗下包括京东金融、京东城市、京东农牧、京东钼媒、京东少东家五大子品牌。京东数字科技的经营宗旨是用数字科技连接金融和实体产业,助力产业提升互联网化、数字化、智能化水平,推动实体经济的发展,创造社会价值。京东数字科技以数据技术、AI、IoT三大时代前沿技术为核心,已经完成在数字金融、数字城市、数字农业、数字营销、数字校园等领域的全面布局,在客户群体上实现了个人端,企业端,政府端的三端合一。未来,京东数字科技将在深耕现有业务领域的同时,进入更多实体产业领域。

教授和学生,相互成就对方。