始于2013年投了一堆项目,终成就 Google 大楼里的垃圾分类机器人

始于2013年投了一堆项目,终成就 Google 大楼里的垃圾分类机器人

谷歌为机器人注入人工智能。如此,可以辅助完成一些任务的机器人,也许有一天就可以为老年人提供一个支撑臂,或者分类垃圾?

在最近一次参观 Alphabet X 实验室后,国外知名媒体人 Tom Simonite,在 wired 文章中讲述了一个这样的小插曲:

「我倒掉咖啡,把杯子放在了一个标有「罐头和瓶子」的托盘上。这种「违规」行为很快就得到了补救。20 分钟后,一个只有一只手臂、高达胸部的轮式机器人疾驰而过,并用装在它扁平脑袋里的 3D 摄像机,观察着杯子。然后,它伸出手臂,用两个结实的黄色手指,把这个错误的杯子,移到旁边「堆肥」标签的绿色托盘上」。

快想想他的样子,这就是个可以走出动画的瓦力啊!

1 真机版「瓦力」

这个可以识别垃圾的机器人,来自于一个名叫「Everyday Robot」的项目。

众所周知,垃圾识别类的机器人项目已开发多年,但是在公共领域应用的思考,对于 X 来说才刚刚开始。

应用从自己家开始:

在山景城 X 之家附近,一些新机器被成圈地放置在垃圾站前,供二楼的工作人员使用。用来练习他们的导航,和将垃圾从堆肥和垃圾填埋场垃圾中分类回收的能力。

另外一些相同设计的机器人,则被安排在 Alphabet 大楼附近。项目的核心恰恰在于 X 大楼的二楼。

仿佛是对办公室生活的一种讽刺:

与 X 工程师的办公桌混在一起,靠近窗户俯瞰的最佳位置,近 30 个灰色的单臂机器人在各个工作站上劳作。每个人站在装满垃圾的三个托盘前,一整天都在把垃圾分配到不同的托盘里,分为「堆肥」和「填埋」,以便回收。

当机器人把所有东西都放好后,它会在每个托盘上抬起一个把手,把分类好的垃圾倒入下面的垃圾桶里,然后,一个人类主管会把新一批垃圾,分给他们继续分类。这个系统被 X 工程师命名为 playpen。

始于2013年投了一堆项目,终成就 Google 大楼里的垃圾分类机器人


这个有意思的项目出就自于山景城里的 X 实验室。

背靠谷歌母公司 Alphabet,成立于 2010 年的 X 实验室,曾不时冒出过一些如太空升降梯、气球上网、海水提炼燃料、智能眼镜等天马行空的想法,但他们有一个目标:系统化挑选有前途技术。这个创意工厂坚持三个重要条件,排除那些 99% 的跨不过「高门槛」的项目:

1. 必须是解决能够影响数百万甚至数十亿人的大问题

2. 必须提出彻底解决这个问题的办法

3. 必须有突破性的技术来解决问题。

这么看来,垃圾分类机器人也许就能实现以上三点中的其中一点。

2 如何创造「瓦力」

始于2013年投了一堆项目,终成就 Google 大楼里的垃圾分类机器人


领导 X 实验室机器人项目的汉斯——彼得·布朗多希望有一天能制作出帮助老年人在家里更独立生活的机器人版本

垃圾分类不是项目的最终目标。「我们想尝试制造这样的机器人,你明白,就是能够和我们一起生活,帮助我们在日常生活中度过难关的那种,」领导该项目的挪威高管汉斯-彼得·布朗多(Hans-Peter Brondmo)说道。这就是该项目的「登月计划」,一个实验室自我神化的代指。

垃圾分类被视为一项对于便利的挑战,被用来验证该项目的方法,以便于创造更具能力的机器人。它利用与谷歌合作开发的人工智能软件,制造出可以通过在职体验,学习复杂任务的机器人。希望能使机器人在技术上减少对人类编码的依赖,并能快速适应复杂的新任务和环境。

这个移动错位咖啡杯的机器人使用了一个控制系统,即前文提到的 playpen。该系统是由数十个机器人,耗时五个月,通过收集每周五天的垃圾分拣经验,磨练而成。X 实验室表示,它的「猎月」员工们通常把大约 20% 的垃圾放错位置,而这些机器人可以将这一比例降低至 4% 以下,来帮助 Alphabet 实现山景城的回收目标。

传统意义上,机器人遵循人类编码员编写的特定指令。通常,机器人会在工厂等受控环境中工作。但是,在家中或是办公室里,帮助人们的机器人面临着太多环境的变化,而编码人员无法预测,或是对这些变化作出对响应。

「这只不过是打鼹鼠的游戏,」本杰·霍尔森(Benjie Holson)说。这个留着胡子,穿着锡制机器人衬衫的软件工程师,看着游戏室里慢慢地移动的机器人说:「我们最大的赌注是编写一个程序,让机器人在野外练习打鼹鼠。」

布朗多则说:「我们还没有解决整个问题,但我们已经取得了足够多的进展,对于我们正在做的事情,我们有很有信心。」

正当他说话时,机器人偶尔会在垃圾站之间来回走动。偶尔从他的办公室经过。这样也能看出项目目前的进展和局限。同时每一个机器人都有至少一名 X 员工的看护,如果出了什么问题,可以按机器人脖子上的红色按钮停止他的行动。

3 一场数百万美元的混战

「Everyday Robot」项目最早开始于 2013 年。

2013 年,谷歌高管、安卓(Android)联合创始人安迪•鲁宾(Andy Rubin)辞去了该公司 Android 移动软件部门的领导职务。在他离开之前,该部门进行了一些引人注目的收购:这些初创公司的技术从全人形机器人到工业机器手臂等,其中包括 MIT 分支的波士顿动力(Boston Dynamics)。

疯狂地用公司支票给机器人消费的行为,让谷歌开始认真做起了机器人。

但鲁宾从来没有公开地为那些机械生物提出过明确的策略。在被指控性骚扰后,于 2014 年离开了谷歌,把剩下的问题留给了其他人。

2016 年,布朗多加入了 X 实验室。就在他刚刚加入之前,Alphabet 的领导们认为 X 实验室是其脱节机器人技术孵化的最佳场所(波士顿动力公司于 2017 年被出售给日本软银集团。)

也许是因为 X 实验室是世界上唯一一个鼓励、甚至要求定期探究荒唐想法的组织。

就像上文中提到的那样,X 实验室曾悄悄地探讨过太空升降梯和冷核聚变方案,放弃了尝试过的磁悬浮式的悬浮滑板、海水燃料设计;但他们也成功制造了能配送空气动力套件的无人机,用各种各样方式生产的自动驾驶汽车,以及设计了通过眼泪就可以测试糖尿病患者血糖水平的隐形眼镜。

尽管项目拦截率高达 99%,他们还是出产了 Waymo 无人驾驶、Google Watch、Dandelion 地热能源以及 Verily 医疗等「毕业项目」。

根据今年 3 月的一份报告显示,谷歌显然正在重新涉足机器人领域。X 的领导层利用谷歌的机器人「残羹剩饭」创建了多个「登月项目」。由布朗多领导的 Everyday Robot 是第一个被公开的。其新机器人也在学习如何抓取,但谷歌的工作似乎与日常机器人有所不同。

谷歌的人工智能研究小组参与了这一「赌注」。它专门研究机器学习算法,从示例数据中获取技能,并在大约五年前开始将其应用于机器人控制。X 工程师在这个项目上进行了合作,并托管了硬件。

这项合作的第一个成果被称为「手臂农场」。

14 个工业机器人手臂,简单地把握住的一些钢笔、毛绒玩具和画笔等杂物放在装满的托盘前。研究人员编写了一些初始代码,指导机器人抓取物体,并让它们一遍又一遍地执行。他们成功和失败的数据都会提供给机器学习的算法,逐渐完善机器人的能力。经过两个月 80 万次的尝试,它成功地抓住了 80% 以上的物体。

始于2013年投了一堆项目,终成就 Google 大楼里的垃圾分类机器人


Alphabet 公司正在其两栋大楼内测试垃圾分类机器人,他们在那里进行查房,检查垃圾是否正确分类

Everyday Robot 的负责人汉斯-彼得·布朗多告诉《连线》杂志,他希望有一天能制造出一个能帮助老人的机器人。但他也承认,这样的事情可能要过几年了——所以目前看来,机器人在分类垃圾方面会不断进步。

始于2013年投了一堆项目,终成就 Google 大楼里的垃圾分类机器人


X 和 Google 后来增加了一种称为强化学习(reinforcement learning)的技术,被应用于棋盘游戏 Go 中并历史性地击败一名冠军。还被用来和来自 arm farm 的数据结合,这部分数据来源于与机器人在模拟实验室中的数字双打。结合仿真数据,七个实体机器人不到一天的工作,就为系统提供了足够的数据,使系统可以在 90% 以上的时间成功地抓取物体。

X 的 playpen 系统中的机器人,为这种方法的改进提供了动力。

他们每天一遍又一遍地分类和抓取垃圾。到了晚上,在一些如 X 实验室两倍的建筑中,收集更多的经验。这两项工作的数据结果,每晚都被用于调整控制系统的算法。经过质量控制检查,以避免流氓机器人。每星期或每两个星期控制系统都会得到一个升级。

自 6 月份开始,这些机器人已经将他们分类的错误率减少到 3.5%。在这个过程中,机器人开发出了更可靠的方法。当物品被它们击倒时,它们可以更好地将手指放在杯子和罐头之类的物品上,抓起来。花在 playpen 上的时间,可以看出一些惊人的技术复杂度。playpen 的机器人有时会使用滑动或搅拌动作来移动物品,这种方式更便于它们看到和抓取。

你不必花很长时间和 X 的机器人呆在一起,就能明白他们还没有做好服务日常的准备。

在 playpen 中,一个机器人抓向稀薄的空气,而不是它看起来要瞄准的碗。不受受惊,它其实真正放下它的动作。有时它们也会和托盘边缘发生碰撞,或摸索物体。如果一个机器人失去了一根手指,监督它的工程师会立马挥舞着螺丝刀跳起来。

为该项目定制的机器人,结合了由 Waymo 开发的 3D 激光扫描仪或激光雷达等高端部件,以及广泛使用的塑料,这会使未来的商用版本更加实惠。这项工作也正在进行中。

机器人设计师 Justine Rembisz 说:「因为我们还处在这个过程的早期,而它们并不总是按照我们希望的方式工作。」

X 公司有一个机器人法医小组,全天致力于找出机器的故障。

一个最新案例需要弄明白的是,当机器人被引入第二座 Alphabet 大楼进行测试时,它们为什么拒绝移动。结果表明,建筑物天窗的光线,使机器的传感器在地板上产生幻觉。

「机器人的症状常常让人有些困惑,」法医小组的负责人莎拉·科(Sarah Coe)这么说。

最大的疑惑在于,机器学习是否真的能让机器人完成许多不同的日常任务。

「每个人都有这样的直觉,」加州大学伯克利分校教授、创业协变公司(startup Covariant)的联合创始人彼得·阿比尔(Pieter Abbeel)说,该公司寻求将机器人学习应用于工业和商业环境。「你学会了分类垃圾,于是现在又能更快地学会下一件事,也许还能摆好桌子。」

尽管 X 实验室和他人取得了令人鼓舞的成果,但还没有人证明直觉是正确的。

阿比尔说:「没有确凿的证据表明,机器人技术中的任务之间存在大量的转移。「也许人们还没有建立一个足够大的实验来实现它。」

布朗多说,如何证明花几个月时间学习的垃圾分类,将有助于他的机器人更快地完成其他任务,是他团队 2020 年优先的任务之一。

当被问及在多久之后,日常机器人才能成为有用的帮手时,他谈到,在遥远的一天,这样的机器如何帮助像他母亲这样的一类人——他母亲最近已经 81 岁了,每天靠着看护的四次到访维持正常生活。

「当我给她打电话时,她说的第一句话总是『机器人什么时候来』,」布朗多说。这个问题是开玩笑的,他的答案也是。「我说,『嗯,可能还要再过几年。』」

产业智慧城市计算机视觉图像分类机器人技术
相关数据
Waymo机构

Waymo是Alphabet公司(Google母公司)旗下的子公司,专注研发自动驾驶汽车,前身是Google于2009年开启的一项自动驾驶汽车计划,之后于2016年独立。2017年10月,Waymo开始在美国亚利桑那州的公开道路上试驾。2018年12月,Waymo在凤凰城郊区推出了首个商业自动乘车服务Waymo One。

http://www.waymo.com/
彼得·布朗人物

Peter F. Brown是Renaissance Technologies Corp的联合总裁、联合CEO兼董事,自2010年1月起加入Renaissance Technologies Corp。

激光雷达技术

自动驾驶车辆传感器的一种,采用激光扫描和测距来建立车辆周围环境的详细三维模型。Lidar 图像具有高度准确性,这使得它可以与摄像头、超声波探测器和雷达等常规传感器相提并论。然而激光传感器面临体积过大的问题,同时,它的机械结构非常复杂。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

自动驾驶汽车技术

自动驾驶汽车,又称为无人驾驶汽车、电脑驾驶汽车或轮式移动机器人,是自动化载具的一种,具有传统汽车的运输能力。作为自动化载具,自动驾驶汽车不需要人为操作即能感测其环境及导航。

机器人技术技术

机器人学(Robotics)研究的是「机器人的设计、制造、运作和应用,以及控制它们的计算机系统、传感反馈和信息处理」 [25] 。 机器人可以分成两大类:固定机器人和移动机器人。固定机器人通常被用于工业生产(比如用于装配线)。常见的移动机器人应用有货运机器人、空中机器人和自动载具。机器人需要不同部件和系统的协作才能实现最优的作业。其中在硬件上包含传感器、反应器和控制器;另外还有能够实现感知能力的软件,比如定位、地图测绘和目标识别。之前章节中提及的技术都可以在机器人上得到应用和集成,这也是人工智能领域最早的终极目标之一。

工业机器人技术

工业机器人是面向工业加工制造的可自动控制,多用途,需有三轴及以上可编程的固定或可移动机械手。其系统中包括带有执行机构的机械手以及示教控制器。 它可以依靠自身控制能力来执行预设的轨迹及动作。典型应用包括焊接,刷漆,组装,采集和放置等工作。工业机器人完成工作具有高效性,持久性和准确性。目前常用的工业机器人包括关节机器人,SCARA机器人,并联机器人和直角坐标机器人等。

无人机技术

无人机(Uncrewed vehicle、Unmanned vehicle、Drone)或称无人载具是一种无搭载人员的载具。通常使用遥控、导引或自动驾驶来控制。可在科学研究、军事、休闲娱乐用途上使用。

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

加州大学伯克利分校机构

加利福尼亚大学伯克利分校,简称加州大学伯克利分校,又常被译为加利福尼亚大学伯克莱分校,位于美国加利福尼亚州旧金山湾区伯克利市,是一所世界著名的公立研究型大学。其许多科系位于全球大学排行前十名,是世界上最负盛名的大学之一,常被誉为美国乃至世界最顶尖的公立大学。

https://www.berkeley.edu/
推荐文章
暂无评论
暂无评论~