徐丹作者

蛰伏三年,达摩院首款无人驾驶终端产品,阿里牵出一头「小蛮驴」

小蛮驴的出现,对整个物流机器人市场来说都是一场变革。长久以来停留在小规模试验的物流机器人终于要落地在大街小巷。

阿里动物园再添新成员。

9 月 17 日阿里云栖大会上,一只名叫「小蛮驴」的新动物款款登场——

这是一款无人车形状的机器人,车身线条圆润,外观采用银灰色调,自带萌感。车身内部是类似驿站的柜机系统,分成一个个可自由定制的格口,最多可载 50 件常规尺寸快递 / 外卖。

视频中小蛮驴行驶时可自动规划路线,灵巧避开各种障碍,带有语音功能:「我要倒车了,请避开」。

不难看出,「小蛮驴」真身就是物流机器人。

天猫、飞猪、蚂蚁、盒马、菜鸟… 如今「阿里动物园」已经渗透到了生活的方方面面,而每一只「动物」背后都代表着一款神级应用和庞大的生态体系。这一次,阿里将目光对准了末端物流。

末端物流简单来说就是指面向园区、学校、小区等场景提供外卖、快递等最后三公里配送服务。

末端物流是一个想象力非常大的场景。根据国家邮政局,今年全国快递业务量已经突破 500 亿件,不久的将来中国每天将产生 10 亿个配送订单,市场空间将会是千亿级别。

同时,该市场看似简单,但因场景复杂,「非结构化」特征突出,技术壁垒很高。在乘用车无人驾驶落地前夜,末端物流场景刚好作为自动驾驶技术「练兵场」。

小蛮驴是阿里首款可量产的物流机器人,最早明年我们就可以在菜鸟驿站里看到小蛮驴身影。

届时取快递的流程会是这样:先在手机 App 中指定由机器人配送并预约时间,驿站工作人员拣选包裹,机器人到达后电话通知,消费者可用取货码、二维码、人脸识别等方式取出快递。

身为物流机器人,小蛮驴所有参数都是依据末端物流场景特征设计。

考虑到安全性,机器人平均速度 15km/h,只有人步行速度的 3 倍,最高速度 20km/h;抽拉式充电电池,一次充电可续航 102 公里;行驶 100 公里耗电量仅 4 度,不到吃两小时火锅用的电;功率 615w,不到常规家用电磁炉的三分之一。

但配送效率可观,如果按每天送货 10 次,每次满载计算,小蛮驴峰值运力可达一天 500 单。

安全、耐用、省料,如果用一个动物形容这款机器人,恐怕只有驴。

「驴曾经是中国人最常用的劳动、代步、赶集、载货工具,专职末端物流服务的小蛮驴,可以说是数字原生时代的赶集工具。他像驴一样暖萌、可靠、通人性,还有一股使命必达的蛮近。」

而「蛮」在浙江方言中常被用作程度副词,「这头诞生于浙江的小蛮驴,是蛮聪明、蛮能干、也蛮安全的。」

不过现在提到物流小蛮驴和物流机器人,已经不是一个新概念。末端无人配送市场早已玩家云集,阿里小蛮驴只能说是一个后来者。

不过,后来必定会有后来者的杀手锏。

一、达摩院蛰伏三年首款无人驾驶终端产品:自动驾驶率 99.9999%

这个杀手锏是两个关键词,一个是「智能」。

小蛮驴背后依托的是达摩院自动驾驶实验室,是其蛰伏三年推出的搭载自动驾驶技术的第一款终端产品。

末端配送是一个看似简单但对技术要求很高的复杂场景,一个很重要的特征就是「非结构化」。

虽然没有拥挤的车流和复杂的交通规则,但随处可见行李、包裹、施工场景。机器人周围几十米就有超过百级别的交通参与者,包括行人、自行车、车辆、滑板车甚至调戏机器人的人等等,行人逆行、车辆转弯、急停、倒车等也屡见不鲜。

如果没有足够智能的技术支撑,普通机器人很容易被「冻住」——认为环境不确定性太高,所有向前的路径都不安全,所以自我冻结以避免碰撞。

但小蛮驴可以顺畅处理这些场景,在人群密集、天气恶劣甚至无 GPS 信号的情况下行驶。

「小蛮驴采用 L4 级自动驾驶技术,自动驾驶率已经达到了 99.9999%。」达摩院自动驾驶实验室资深算法专家陈俊波在接受采访时举了两个例子:

比如,一些末端场景中会有路桩,路桩中间有一条非常细的连接带,宽度不超过三公分,小蛮驴可以精准识别并绕行。

再比如,面对数量庞大的交通参与者,小蛮驴可以在 0.01 秒内识别 100 个以上的行人和车辆的行动意图,遇到紧急情况需要刹车时,能在 0.1 秒内完成决策、规划和控制指令下发。

如果拆解小蛮驴底层技术,会发现这就是达摩院人工智能自动驾驶技术的集大成者。

预测行人动机靠的是算法,地图信息、行人信息、道路障碍交通标志等信息都需要进行特征提取放到深度学习框架中,进行推断和决策,相当于机器人的「脑袋」。

大脑对于自动驾驶决策至关重要。达摩院自动驾驶实验室负责人王刚有一个观点,「目前制约自动驾驶发展的最大瓶颈依然是算法不够优秀,所以就算把当今世界上最先进的传感器、计算单元都集成到一辆车上,这辆车仍然无法实现完全自动驾驶。」

所以阿里一直在算法方面有比较大的投入,典型代表是「大中台,小前台」的独特系统。

大中台指的是「AutoDrive 自动驾驶机器学习平台」。将算法链中人工参与设计的环节(如数据预处理、感知模块神经网络结构 / 超参数、定位模块中的融合参数等)改为机器执行,大大提高技术研发迭代的速度和效率

AutoDrive 一个明显优势在于背靠阿里云。阿里搭建了自己的自动驾驶云平台,海量的数据(场景数据库、自动驾驶车数据、数据采集车数据)都被搬到了阿里云上,打通了数据收集、数据标注、仿真、模型训练、评价等一整套系统,让自动驾驶算法研发效率更高。

目前机器人的运行数据只能是回到停车场后联网上传,一旦 5G 普及,就可以实时数据上传,使模型更快、更有效率的进行迭代和优化。

小前台就是感知、定位、决策、控制这样的自动驾驶算法模块,依靠 AutoDrive 后方中台可以找到效果更优、运算更快、模型更小的算法模型。

识别宽度不超过三公分的路桩连接带靠的是感知能力,即机器的「视力」。

这方面阿里采用紧耦合算法,实现了 GPS、惯导、轮速、相机、激光雷达等多模态传感器的融合,可在无 GPS 情况下实现厘米级定位。

搭载了达摩院自主研发了提高摄像头「夜视」能力的 ISP 处理器,支持 200 万像素图像处理,可同时处理 6 个摄像头和数据传输,通过 3D 降噪和图像增强算法,图像识别能力比业内主流 ISP 处理器有 10% 以上的提升。

激光雷达感知能力的提升来源于达摩院自主研发的多层级快速稀疏 3D 卷积网络算法。针对激光雷达成像在远处点云稀疏的数据特点,做针对性定制化深度学习网络。通过多层级的信息提取,提取到详细的几何信息(颜色、条纹)和高层的语义信息(人、汽车)。

所以,整个达摩院自动驾驶实验室和阿里云就是小蛮驴的后方技术支撑。而对于达摩院来说,末端物流是一个绝佳的自动驾驶「练兵场」,复杂的场景可以更好的锤炼技术、更新算法。

未来,小蛮驴会从末端社区、学校、园区往城区、高速等更开放的场景延伸发展。

二、计算单元成本降低 50%,无人配送「量产」成为可能

另一个是「量产」。

国内的末端无人物流机器人从 2015 年开始起步,这个市场空间大、想象力广、竞争格局未定,玩家甚多。不管是拥有技术的互联网大厂,还是拥有场景的物流巨头,抑或是创业公司都想入场分一杯羹。

虽然可以零零星星的从报道中窥见各个厂家的落地情况,但现实中似乎一直未见物流机器人的真容。

问题就在于,现在几乎没有厂家能真正解决「量产」的问题。

第一量产需要降成本,现在激光雷达、传感器等技术尚未成熟,价格昂贵;第二 L4 级自动驾驶意味着需要摆脱人类安全员,机器人担任责任主体,但现在机器人的安全性能得不到完全保障。

小规模试运营永远无法落地大街小巷实现商业价值,同时也没办法保证机器人产品的一致性和质量。

小蛮驴的最关键的创新点就在于已经大幅度降低了机器人的制造成本,不久的将来就会与车企合作大规模量产。

「我没有看到任何一家公司能做到千万级别的出货量,我们希望小蛮驴能够迈出,从小规模试运营到量产的关键一步。」

如何降本?背后还是离不开雄厚的研发能力。陈俊波介绍,物流机器人成本主要集中在三方面:传感器、技术设备和运动底盘,达摩院是基于这三块做了大规模的硬件深度定制和软硬件一体化的设计。

比如,在定位设备方面,大多数自动驾驶公司或机器人公司会采用惯性导航系统,但惯导价格非常昂贵,仅这一个系统市场价就 10 万以上。

而达摩院自动驾驶实验室有一个自研软硬件一体化定位设备,是结合惯性导航和 GPS 的一个综合定位模块,定位效果不变的情况下综合成本有一个数量级的下降。

再比如,无人驾驶车的计算设备一般用工业计算机,但工业计算机功耗大、成本贵、体积大,运用到量产化产品中对续航里程、快递运载量以及整车成本控制都很不利。

基于此,达摩院设计了嵌入式异构的计算单元,这种计算单元高度集成化,可在大幅度降低功耗、成本的情况下提高系统稳定性,但算力只有工业计算机的 1/3。

这就对软件算法提出了非常高的要求,需要在模型效果没有任何降低的前提下将算力控制在工业计算机的 1/3,达摩院已经实现了这个技术。「这是我们的核心竞争力。」陈俊波说。

整体来看,软硬件协同优化可将计算单元功耗降低 72%、成本降低 50%、体积压缩 62%。

底盘方面,制动系统与驱动系统实现二合一,整车重量降低 44%,电子电器拓扑精简 40%,成本降低 31%。

达摩院去年发布的 AutoDrive1.0 平台已经升级到了 AutoDrive2.0 版本,升级部分就在于利用自动化学习平台协同优化和硬件。

成本控制之外,量产还意味着产品要有「极致安全性」,达摩院设计了一个「五重冗余」的安全体系。最重要的是人工智能大脑,做整体的定位、感知、预测、决策、规划、控制;第二是冗余的安全小脑,当大脑出现问题时负责兜底;第三异常检测子系统,一旦出现意外紧急刹车;第四物理防撞触边的设计;最后,在有必要的情况下,让人类安全员远程监控。

三、物流机器人,不止于物流

阿里做末端物流机器人其实有得天独厚的优势——很少有企业像阿里一样,既背靠强大的技术平台,又有广阔的应用场景。

小蛮驴首先会在菜鸟驿站大规模落地,配合菜鸟生态打造无人配送体系,菜鸟如今已经是一个庞大的末端物流网络,日均处理的包裹已超过 1000 万。

未来还会应用于盒马、饿了么等新零售和本地生活业务。应用场景主要在高校园区、工业园区和社区。

当我们说新零售和本地生活业务场景时,其实不止是常规的快递和外卖,这个场景会产生很多的末端物流需求,比如社区团购,比如产品试样时的样品派送。

阿里本身在末端新零售场景有很深的布局,前段时间媒体报道阿里零售通事业部近期正在组建一个新的社区团购部门,以社区为单位,招募各小区的宝妈或便利店店主为 “团长”,在微信群里推广生鲜商品,收集订单,再通过自有渠道供货,次日将商品送至小区由用户自取。

这些业务都需要强大的配送服务支持,在外卖适龄劳动力逐渐减少的情况下,物流机器人可以与外卖员 / 快递员相配合,打造一个零售服务闭环。

如果再往外拓展,物流机器人也可以不止是一个单一形态的机器人。

「我们希望搭建的是底层的人工智能机器人技术平台,在这个平台我们可以快速的搭建出针对各个场景适用的机器人产品,在基于这些产品赋能阿里经济体的各个具体的业务单元。」陈俊波说。

简单来说,物流机器人未来会是一个「平台」。

未来阿里会将小蛮驴通用技术点(比如高精度定位、硬件方案、软件算法)抽象提炼出来,沉淀到平台中,平台也会依托阿里云,变成一个整体的自动驾驶云平台,包括数据平台、仿真平台、测试平台等。

「任何一家机器人初创公司都没有这样的完整的系统化能力,我们希望把自己的能力沉淀出来开放给整个机器人产业。」陈俊波说。

基于这个平台,未来就可以像组装乐高一样快速开发针对多元场景的移动机器人,比如消防救援、安全巡防、机场服务、防疫消杀、景区导览等。

此外,除轮式机器人,阿里未来还会开发双足、履带等各种不同类型的机器人产品,让其可以爬山涉水、上高楼下地库。

不过,这些都属于战略规划范围。小蛮驴的发布最值得期待的还是,从来「与我无关」的无人配送机器人终于要在自己的生活中出现了。
产业无人快递机器人技术阿里巴巴智能物流
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

激光雷达技术

自动驾驶车辆传感器的一种,采用激光扫描和测距来建立车辆周围环境的详细三维模型。Lidar 图像具有高度准确性,这使得它可以与摄像头、超声波探测器和雷达等常规传感器相提并论。然而激光传感器面临体积过大的问题,同时,它的机械结构非常复杂。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

异常检测技术

在数据挖掘中,异常检测(英语:anomaly detection)对不符合预期模式或数据集中其他项目的项目、事件或观测值的识别。 通常异常项目会转变成银行欺诈、结构缺陷、医疗问题、文本错误等类型的问题。 异常也被称为离群值、新奇、噪声、偏差和例外。

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

超参数技术

在机器学习中,超参数是在学习过程开始之前设置其值的参数。 相反,其他参数的值是通过训练得出的。 不同的模型训练算法需要不同的超参数,一些简单的算法(如普通最小二乘回归)不需要。 给定这些超参数,训练算法从数据中学习参数。相同种类的机器学习模型可能需要不同的超参数来适应不同的数据模式,并且必须对其进行调整以便模型能够最优地解决机器学习问题。 在实际应用中一般需要对超参数进行优化,以找到一个超参数元组(tuple),由这些超参数元组形成一个最优化模型,该模型可以将在给定的独立数据上预定义的损失函数最小化。

机器人技术技术

机器人学(Robotics)研究的是「机器人的设计、制造、运作和应用,以及控制它们的计算机系统、传感反馈和信息处理」 [25] 。 机器人可以分成两大类:固定机器人和移动机器人。固定机器人通常被用于工业生产(比如用于装配线)。常见的移动机器人应用有货运机器人、空中机器人和自动载具。机器人需要不同部件和系统的协作才能实现最优的作业。其中在硬件上包含传感器、反应器和控制器;另外还有能够实现感知能力的软件,比如定位、地图测绘和目标识别。之前章节中提及的技术都可以在机器人上得到应用和集成,这也是人工智能领域最早的终极目标之一。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

图像处理技术

图像处理是指对图像进行分析、加工和处理,使其满足视觉、心理或其他要求的技术。 图像处理是信号处理在图像领域上的一个应用。 目前大多数的图像均是以数字形式存储,因而图像处理很多情况下指数字图像处理。

图像增强技术

图像增强技术用于增强图像中的有用信息,它可以是一个失真的过程,其目的是要改善图像的视觉效果,针对给定图像的应用场合。它通过有目的地强调图像的整体或局部特性,将原来不清晰的图像变得清晰或强调某些感兴趣的特征,扩大图像中不同物体特征之间的差别,抑制不感兴趣的特征,使之改善图像质量、丰富信息量,加强图像判读和识别效果,满足某些特殊分析的需要。

移动机器人技术

移动机器人是一种能够移动的自动机器。移动机器人具有在其环境中移动的能力,并且不固定到一个物理位置。移动机器人可以“自动”主要是指它们能够在没有物理或机电引导装置的情况下导航非受控环境。相比之下,传统的工业机器人或多或少都是固定的(stationary)机械臂或抓取组件。

阿里云机构

阿里云创立于2009年,是全球领先的云计算及人工智能科技公司,致力于以在线公共服务的方式,提供安全、可靠的计算和数据处理能力,让计算和人工智能成为普惠科技。 阿里云服务着制造、金融、政务、交通、医疗、电信、能源等众多领域的领军企业,包括中国联通、12306、中石化、中石油、飞利浦、华大基因等大型企业客户,以及微博、知乎、锤子科技等明星互联网公司。在天猫双11全球狂欢节、12306春运购票等极富挑战的应用场景中,阿里云保持着良好的运行纪录。 阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。 2014年,阿里云曾帮助用户抵御全球互联网史上最大的DDoS攻击,峰值流量达到每秒453.8Gb 。在Sort Benchmark 2016 排序竞赛 CloudSort项目中,阿里云以1.44$/TB的排序花费打破了AWS保持的4.51$/TB纪录。在Sort Benchmark 2015,阿里云利用自研的分布式计算平台ODPS,377秒完成100TB数据排序,刷新了Apache Spark 1406秒的世界纪录。 2018年9月22日,2018杭州·云栖大会上阿里云宣布成立全球交付中心。

https://www.aliyun.com/about?spm=5176.12825654.7y9jhqsfz.76.e9392c4afbC15r
5G技术

第五代移动通信系统(5th generation mobile networks),简称5G,是4G系统后的延伸。美国时间2018年6月13日,圣地牙哥3GPP会议订下第一个国际5G标准。由于物理波段的限制,5G 的网络也将会与其他通信技术并用,包含长距离的其他传统电信波段。

暂无评论
暂无评论~