Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

蛋酱编辑

雷军家的「铁蛋」亮相:一只9999元会打滚、空翻的机器狗(未来将开源)

小米进军仿生四足机器人了,中文名「铁蛋」,英文名「CyberDog」。


这是谁家的狗?时尚、动感,还有些许威风凛凛。


在昨晚 MIX4 发布会的结尾,雷军突然公布了小米家族的新成员——「铁蛋」。


「铁蛋」是它在小米内部的昵称,据说如此取名一般都会「命硬」,预示着开发容易成功。中文名主要负责接地气,英文名还得兼顾国际范儿,「CyberDog」在气质这一块拿捏得死死的。

仔细一看,从外型上还挺像《黑镜》里的机器狗:



据雷军介绍,CyberDog 仿生四足机器人拥有仿生的运动步态,还拥有仿生的视觉和听觉交互体验,让它可以听从指令、识别主人甚至自动跟随主人运动。

现场,雷军还展示了「铁蛋」听人话、翻跟头等技能:

「铁蛋,站起来跟大家打个招呼!」


「听说你会翻跟斗,现场给大家演示一下?」



关键在于,和 B 家机器狗 50 多万元的价格相比,CyberDog 工程探索版的购入价格仅为 9999 元,小米表示将先拿出 700 台进行小范围限量发售。

「铁蛋」的身体构造

CyberDog 内置小米自研的伺服马达,提供 32N·m 最大输出扭矩、220rpm 最大转速以及 3.2m/s 的最快移动速度。这是它完成诸多复杂动作的基础:奔跑、跳跑、左右转体、前倾后仰、作揖、握手、打滚、后空翻。

左右转体。


打滚。

搭配运动控制算法,CyberDog 能够适应多种复杂地形,即使受到外力干扰也能快速恢复平衡。



CyberDog 的大脑是英伟达的 Jetson XavierTM NX 平台,这是一台用于嵌入式和边缘系统的 AI 超级计算机,包括 384 个 CUDA 核心、48 个张量核心、6 个 Carmel ARM CPU、2 个深度学习加速引擎。这保证了 CyberDog 可以毫无障碍地处理从传感器系统捕获的大量数据,准确领会主人的意图。

为了完全模拟生物体,CyberDog 搭载了高精度环境感知系统,全身 11 个高精度传感器向 AI 大脑实时传输信息,包括触摸传感器、摄像头、超声波传感器、 GPS 模块等,可以感知图像、光线、距离、速度、声音等环境信息,通过即时反馈来引导自身运动。



在 CyberDog 的设计上,小米工程师特别注重增强其感知周围环境的能力。机器狗嵌入了一系列摄像头传感器,包括人工智能交互式摄像机,双目超广角鱼眼摄像机,以及 Intel RealSenseTM D450 深度模块,并且可以通过计算机视觉算法进行训练。

建立在这个视觉传感器系统上的是自主的目标跟踪、 SLAM 和厘米级的避障及导航。这意味着 CyberDog 可以实时分析周围环境,创建导航地图、标出目的地、避开障碍物。结合人体姿势和人脸识别跟踪,CyberDog 能够跟随主人并绕过障碍物。

 
用户可以通过语音助手设置唤醒词来命令和控制 CyberDog,也可以用附带的远程和智能手机应用程序。此外,CyberDog 提供了丰富的外部接口,包括 3 个 C 型端口和 1 个 HDMI 端口,开发者可以自由探索和集成各种创新的硬件附加组件或软件系统,比如搜索灯、全景摄像机、动态摄像机、 LiDAR 或其他。

机器狗家族


成熟的业界仿生四足机器人,是由波士顿动力创始的。后续追随者所打造的产品总有「大同小异」的味道,不过硬件价格一直在下降,这或许会带来更多的落地应用契机。

斯坦福学生机器人俱乐部曾经开源了 Stanford Doggo 四足机器人,所有代码和设计图都能免费获得,DIY 成本不高于 3000 美元。Doggo 能完成走路、慢跑、跳舞、跳跃等动作,偶尔也能表演一下后空翻。



今年 6 月,国内的宇树科技发布了 Unitree GO1,共有三个版本:售价 2700 美元的 G01 Air base 型号、售价 3500 美元的 G01 和售价 8500 美元的 G01 Edu。


也就是说,Unitree GO1 起步价仅需 1.6 万元人民币,然而这个价格纪录目前已被小米的「铁蛋」打破了。

一位「铁蛋」诞生过程的参与者,在知乎平台分享了项目开发的经历:

十个月前我们的狗子只是个构想,连个电机都没有。一路来从第一台样机到几台到几十台到几百台,人员也从几个人壮大到几十,从一两个部门到十几个部门参与。


在不到一年的时间里,小米工程师们是怎么打造出「铁蛋」的?

雷军在演讲中提到,CyberDog 是基于 MIT Mini Cheetah 以及 ROS 2 的开源平台打造的。MIT 的 Mini Cheetah 算是后空翻机器人界的首位选手,同时拥有横向移动、跳跃、自动从摔倒中爬起等技能。


小米此次也承诺,仿生四足机器人研发成果将向全球开源。一位参与铁蛋研发的小米工程师在知乎表示,「未来会进行项目的一期开源,并且会陆续把从嵌入式(电机,传感器,外设),Linux 内核,定制后的 rootfs,裁过的 ROS 2 的 repos,还有我们写的基于 ROS 2 的代码,以及基于 Mini Cheetah 改过的代码等等都开源出来。」

之后,大家也许能够做出自己的机器狗来!
入门计算机视觉机器狗小米
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

张量技术

张量是一个可用来表示在一些矢量、标量和其他张量之间的线性关系的多线性函数,这些线性关系的基本例子有内积、外积、线性映射以及笛卡儿积。其坐标在 维空间内,有 个分量的一种量,其中每个分量都是坐标的函数,而在坐标变换时,这些分量也依照某些规则作线性变换。称为该张量的秩或阶(与矩阵的秩和阶均无关系)。 在数学里,张量是一种几何实体,或者说广义上的“数量”。张量概念包括标量、矢量和线性算子。张量可以用坐标系统来表达,记作标量的数组,但它是定义为“不依赖于参照系的选择的”。张量在物理和工程学中很重要。例如在扩散张量成像中,表达器官对于水的在各个方向的微分透性的张量可以用来产生大脑的扫描图。工程上最重要的例子可能就是应力张量和应变张量了,它们都是二阶张量,对于一般线性材料他们之间的关系由一个四阶弹性张量来决定。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

知乎机构

知乎,中文互联网综合性内容平台,自 2010 年成立以来,知乎凭借认真、专业、友善的社区氛围,独特的产品机制,以及结构化、易获得的优质内容,聚集了中文互联网科技、商业、影视、时尚、文化等领域最具创造力的人群,已成为综合性、全品类,在诸多领域具有关键影响力的内容平台。知乎将AI广泛应用与社区,构建了人、内容之间的多元连接,提升了社区的运转效率和用户体验。知乎通过内容生产、分发,社区治理等领域的AI应用,也创造了独有的技术优势和社区AI创新样本。

zhihu.com
推荐文章
暂无评论
暂无评论~