Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

仅靠视觉自主分类物体、能做瑜伽,特斯拉人形机器人再进化

也许未来,真如《终结者》等科幻电影那样,人形机器人将与真人无异。

沉寂了几个月的特斯拉人形机器人擎天柱(Optimus)终于有了新的动态。记得上一次看到它还是在特斯拉股东大会上,当时 Optimus 展示了自由行走、灵活抓取放下物体等技能。

图片

今天,特斯拉 Optimus 又进化了。现在,它可以自主地对物体进行分类了。其中的亮点是神经网络完全端到端训练:输入视频,输出控制。这类似于特斯拉自动驾驶 FSD V12 开发中的神经网络训练 —— 处理所有输入信号,输出驾驶决策。

图片 不禁要问,如何做到的呢?

Optimus 拥有了自我校准手臂和腿部的能力,仅使用视觉和关节位置编码器,它就可以在空间中精准定位自己的肢体。

图片

精确的校准能力使 Optimus 更高效地学习各种任务,并且仅使用视觉,其神经网络完全实现了 on-board 运行。

这样一来,Optimus 可以完全自主地将物体按颜色进行分类。

图片

图片

即便有人干扰,Optimus 也能按颜色将物体准确分类。

图片

Optimus 还展示了自主纠正(将歪倒的物体摆正)的行为能力。

图片

经过训练后,它还能执行新任务,比如将分类好的物体打乱。

图片

经过了一整天的「工作」,是时候伸展一下、做个双手合十吧。

图片

图片

 团队资深软件工程师 Julian Ibarz 表示,「非常高兴分享团队在过去几个月中取得的进展。现在 Optimus 可以完成长期任务,比如完全以任务无关的方式自动对物体进行分类。只需要收集更多数据,则无需更改任何代码就可以训练新的复杂任务。」

图片

马斯克也肯定了这一「进展」。

图片

网友在震惊之余,也提出了一些问题,比如是否可以输入 prompt 让 Optimus 来执行任务?答案是肯定的,视频中使用相同的网络来执行分类或取消分类任务,只需要告诉 Optimus 你想做什么就行了。

图片

Optimus 的「前世今生」

Optimus 并非一开始就是一个实体机器人的,它从「Tesla Bot」这样一个机器人通用计划慢慢孵化。

图片

                            2021 年马斯克在「特斯拉 AI 日」上展示了 Tesla Bot 的大致形态。

甚至在 Tesla Bot 动作展示时,是由工作人员穿着特制的紧身服装,扮成机器人的模样表演了一段舞蹈。但就是这样一个想法,逐渐扎根,并走向现实,一次次突破给人们惊喜。

一年后的「特斯拉 AI 日」上,曾经由人扮演的 Tesla Bot 变为了机器人 Optimus。

图片

                           2022 年「特斯拉 AI 日」上 Optimus 和人们打招呼

刚亮相的 Optimus 已经可以搬运箱子,给花浇水,在工厂里工作。但这不是 Optimus 的最终目标。Optimus 要成为拥有「大脑」的类人机器人

图片

                            Optimus 在特斯拉超级工厂里工作

马斯克表示,当时这个机器人设计出来只用了半年时间,未来成型的样子有很多值得期待的地方。

事实也正如此,2023 年特斯拉股东大会上的 Optimus 的脚步已经更加顺畅,动作也更加熟练。

图片

                           Optimus 灵活抓取、放下物体

而现在,Optimus 已经向着它的目标不断前进,拥有「大脑」的路程也越走越清晰。下一次它将如何进化,我们拭目以待。

参考链接:

https://techau.com.au/tesla-shows-off-teslabot-running-fsd-v12-autonomously-sorting-objects-using-video-in-controls-out/

工程特斯拉人形机器人Optimus
相关数据
Julia技术

Julia 是MIT设计的一个面向科学计算的高性能动态高级程序设计语言,项目大约于2009年中开始,2018年8月JuliaCon2018 发布会上发布Julia 1.0。据介绍,Julia 目前下载量已经达到了 200 万次,且 Julia 社区开发了超过 1900 多个扩展包。这些扩展包包含各种各样的数学库、数学运算工具和用于通用计算的库。除此之外,Julia 语言还可以轻松使用 Python、R、C/C++ 和 Java 中的库,这极大地扩展了 Julia 语言的使用范围。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

类人机器人技术

类人机器人是一种具有与人类相似外形的机器人。类人机器人的主要特性包括:1. 可以在人类日常环境中工作 2. 可以使用人类日常使用的工具 3. 具有与人类相似的外形 目前类人机器人的设计主要来满足功能方面和实验方面的需求。针对功能性设计的类人机器人需要协助人类完成一些高危险,高难度的任务以及辅助病人,幼儿及老年人的日常生活和娱乐等。类人的设计使其可以很好的在人类日常环境中行走以及使用人类日常工具。同时,其类人的交互模式使其可以更好的完成辅助人类以及交互娱乐的功能; 而针对实验需求的类人机器人可以帮助人类更好的探究人类自身的认知,智力,心理等多方面特点。 通常来讲,类人机器人完整的模仿人类的外形,具有躯干,头部和四肢。也存在针对部分特定人体进行仿真的类人机器人,例如只模仿腰部以上的PR2机器人,只模仿腿部的机器人,以及只涉及眼睛和嘴来模仿人类面部表情的机器人(例如Kismet机器人)。此外,仿制人在普通类人机器人的基础上进一步从美学角度上对人类的皮肤,毛发,神态等模仿,从而达到了以假乱真的效果。

推荐文章
暂无评论
暂无评论~