魔王、蛋酱、陈萍编辑

智能手机+3D打印,英特尔只花了50美元造出自主导航机器人

50 美元 + 一台旧手机 = 自主导航机器人?Intel:Yes!


打造一台能够执行人体跟踪、自主导航等高阶任务的轮式机器人,需要多少钱?

「应该挺多的吧,」估计大部分人都会给出这样的回答。

然而,英特尔实验室最近开源的 OpenBot,只需要 50 美元(一顿火锅钱)和一台从抽屉里翻出来的旧手机(四舍五入成本为 0)。

OpenBot 的「大脑」是一台安卓智能手机,「机身」则是花费 50 美元打造的一款电动小车。此外,研究人员还开发了软件堆栈,使智能手机可以对小车执行移动操作。制作似乎很简单,但 OpenBot 实际上能够支持高阶机器人任务,如人体跟踪和实时自主导航。

OpenBot 系统设计图。

Openbot 由两部分组成:一部智能手机和一个机器人外壳。

首先,只要有一部智能手机,就能满足三个方面的需求:处理器(CPU、GPU、AI 计算)、传感器(GPS、摄像头等)和通信接口(蓝牙、4G/5G 网络)。

与此同时,机器人身体的制作成本也相当合理。如果拆解开来,你发现几乎都是常规的组装零件:4 个 TT 马达车轮、1 个 L298N 马达驱动板、电池和电池座、螺钉螺母、弹簧 / 橡皮筋、电线等,或许你还需要 2 个橙色 LED 灯。

整个机身加在一起的成本,不过 50 美元而已。3D 打印模型文件也已经开源,可以在 GitHub 上找到。

项目地址:https://github.com/intel-isl/OpenBot/tree/master/body

大概半小时到一小时,即可完成组装:

接下来就可以上路试验了,研究者分别测试了 Openbot 的人体跟踪和自主导航能力。

在测试了 10 种不同型号的智能手机之后,结果显示,Openbot 始终能够稳定地完成人体跟踪任务。

在自主导航任务中,它还学会了巧妙地躲避办公区走廊的盆栽植物。

接下来我们来看这项研究的核心内容。

为什么选择智能手机?

除了成本以外,选择智能手机作为机器人的「大脑」还有很多优势。定制机器人上的硬件组件会很快过时。而消费级智能手机每年都会迭代,分辨率和相机帧率都在不断提升,处理器更快,传感器和通信接口也更新。

如此一来,那些售价低廉的二手机,如果能作为机器人大脑,也算是被赋予了第二次生命。

智能机的优势不止快速提升的硬件能力,它们还具备蓬勃发展的软件生态系统。这项研究利用移动物理机身和软件堆栈,增强了这款机器人的感知和计算能力。

这项研究的主要贡献包括以下几点:
  1. 基于廉价可用的组件设计了一款小型电动车,硬件成本仅为 50 美元,这款电动车可作为轮式机器人的「机身」。

  2. 开发了软件堆栈,允许智能手机将小车作为机身,并实现实时感知和计算的移动导航。

  3. 该系统能够支持人体跟踪和自主导航等高阶机器人任务。

  4. 大量实验表明,该方法不受智能手机型号和机身变化的影响。

那么,这款轮式机器人的制造细节和效果到底如何呢?我们来看详细介绍。

低成本轮式机器人是如何制造的?

机身

大脑没有身体则无法行动。要想利用智能手机的算力和感知能力,机器人还需要一个身体。

该研究基于可用的电子器件和 3D 打印零件为这个机器人开发了一个身体,总成本 50 美元,其中 40% 用在了电池上。如果构建多个机器人,则成本还会继续下降。所有零件的详情和价格参见下表 1:

表 1:材料价格表。

机身的构造包括机械设计和电路设计两部分。下图展示了这款小车的机械设计:

下图展示了电路设计:

软件堆栈

如下图 4 所示,该软件堆栈包含两部分:安卓应用和 Arduino 程序。

安卓应用在智能手机上运行,可以提供操作界面,收集数据集,运行高阶的感知和控制任务。Arduino 程序负责低阶的驱动和度量(如度量车轮里程、监控电池电压等)。

安卓应用和 Arduino 应用通过串行通信链路进行通信。

与其他轮式机器人有何区别?

该研究将这款轮式机器人与现有的机器人平台进行了对比,参见下表 2。与其他机器人相比,该研究开发的平台拥有智能手机提供的大量处理能力、通信接口和传感器。

现有的机器人通常依赖于定制的软件生态系统,这需要专门的实验室人员来维护代码、实现新功能。而该研究使用了安卓系统——最大且持续发展的软件生态系统之一。无需机器人社区多做努力,所有用于传感器集成和处理的低级软件已经存在且不断改进。所有传感器已经实现时钟同步,从而消除了很多现有机器人面临的主要挑战。

实验

Openbot 迎来的第一项考验是人体跟踪(Person Following),第二项考验是自主导航(Autonomous Navigation)。

人体跟踪任务

该实验研究了在智能手机上运行复杂的 AI 模型的可行性。研究人员使用目标检测器并应用视觉伺服来跟踪人。实验表明,所有最新的中端智能手机均能以 10 fps 或更高的速度持续跟踪人。

自主导航任务

研究人员训练了一个在大多数智能手机上都能实时运行的驾驶策略。学到的策略能够沿着走廊前进,并在交叉路口转弯。研究人员将其与现有的驾驶策略进行比较,并获得与基线相似的性能,而所需参数减少了大约一个数量级。

驾驶策略的训练流程。

除此以外,该研究还成功地将驾驶策略迁移到了不同的智能手机和机身上。实验表明,该研究的驾驶策略能够泛化至之前没见过的环境、新对象,甚至动态障碍物(如人),即使是在训练数据中仅存在静态障碍物的情况下。

下表展示了该研究驾驶策略在新手机上的泛化效果:

下表展示了该研究提出的驾驶策略在不同机身上的泛化效果:

论文地址:https://arxiv.org/abs/2008.10631

工程智能手机英特尔机器人技术
1
相关数据
英特尔机构

英特尔(NASDAQ: INTC)是全球半导体行业的引领者,以计算和通信技术奠定全球创新基石,塑造以数据为中心的未来。我们通过精尖制造的专长,帮助保护、驱动和连接数十亿设备以及智能互联世界的基础设施 —— 从云、网络到边缘设备以及它们之间的一切,并帮助解决世界上最艰巨的问题和挑战。

https://www.intel.cn/content/www/cn/zh/homepage.html
相关技术
感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

目标检测技术

一般目标检测(generic object detection)的目标是根据大量预定义的类别在自然图像中确定目标实例的位置,这是计算机视觉领域最基本和最有挑战性的问题之一。近些年兴起的深度学习技术是一种可从数据中直接学习特征表示的强大方法,并已经为一般目标检测领域带来了显著的突破性进展。

5G技术

第五代移动通信系统(5th generation mobile networks),简称5G,是4G系统后的延伸。美国时间2018年6月13日,圣地牙哥3GPP会议订下第一个国际5G标准。由于物理波段的限制,5G 的网络也将会与其他通信技术并用,包含长距离的其他传统电信波段。

推荐文章
暂无评论
暂无评论~