Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

这家神秘的机器人初创,怕是藏不住了

机器之能报道

编辑:Sia

又一个加速家用机器人“ ChatGPT ”时刻到来的玩家,出现了。

这家机器人初创一直笼罩在神秘之中,直到 Meta 首席 AI 科学家 Yann LeCun 在社交平台上转发它的招聘消息,并公布创始人之一是他在纽约大学的同事 Lerrel Pinto 。

目前,网络上关于这家名叫 Fauna Robotics 的机器人公司的消息几乎为零,甚至找不到公司官网, X 平台官方账户也仅有一句简单介绍,他们 “正在创造一个人类与机器人物种群落共生、协作与共同繁荣的世界。”  不过,我们还是可以从 “ Fauna ”这个词以及关键人物之一 Lerrel Pinto 的背景资料中窥得这家公司的一些线索。

迄今为止,Roomba 和其他机器人吸尘器是唯一真正成功的商业家用机器人。它们之所以如此成功是因为不需要与人类和其所在的环境交互——事实上,它们只要学会避开它们就可以了。Fauna 意思是动物志,看来这家初创希望描述、记录新机器人物种群落的历史,也就是能在不同家庭环境中执行日常家务,与人类共同生活的机器人。这和特斯拉擎天柱、Figure AIDigit1 X 等一众人形机器人公司的野心并无二致,大家都在加速家用机器人“ ChatGPT ”时刻到来。

图片

另外,从公司创始人之一 Lerrel Pinto 研究背景来看,这家公司的宗旨也应该与通用的家用机器人有关。Lerrel Pinto 今年 31 岁, CMU 机器人研究所博士,一直从事着让机器人适应人类生活世界的研究,曾入选《麻省理工学院技术评论》2023 年 35 岁以下创新者之一。目前,Lerrel Pinto 在纽约大学 Courant 计算机系担任助理教授,也是纽约大学计算智能、视觉和机器人实验室( CILVR,由 Yann LeCun 创建)成员。

图片

Linkedin 资料显示,Lerrel Pinto  在一个月前(也就是 2 月)入职 Fauna(这也可能是公司的成立时间)。巧合的是,1 月份,纽约大学与 Meta 联合发布了一个新型开放知识型机器人框架 OK-Robot。这是一种新的通用机器人,集成了大型语言模型( LLMs )、视觉语言模型( VLM )与机器人,能够在真实的家庭环境中完成拾取、移动和放下物体的任务,无需任何额外培训(这些训练通常耗时又昂贵)。

你只需要对这个机器人说,把桌子上的玉米片拿到床头柜上,机器人就能自己找到玉米片,并规划出路线和相应的动作,顺利完成任务。除此之外,它还能帮你整理东西或扔垃圾。

图片


图片


图片

10 个真实家庭环境中的运行测试结果表明,OK-Robot 拾取和放置任务的成功率达到 58.5%,如果家庭环境比较干净整洁,成功率可以提升到 82%。

在纽约市的 10 个家庭环境中,OK-Robot 尝试了 171 个拾取任务。

视频链接:https://mp.weixin.qq.com/s/Zn6-Fct-m8aH_Fd3GC6ZnA

要让机器人在一个完全陌生的环境中从事日常家务,一个巨大挑战就是训练它们需要大量数据,我们可以从互联网上抓取海量数据训练 LLMs,但机器人很难做到这点——训练机器人的数据需要收集真实物理世界的数据,这也导致构建和扩展训练数据集更加困难。

Pinto 和团队想出了一种简单、易于复制的方法来扩大机器人的训练数据集 —— 将苹果手机和常见的垃圾拾取器接起来,用户就能用它来录制自己抓取家中各种物品的视频, iPhone 内置硬件(比如激光雷达、运动传感器和陀螺仪)会记录视频里任务的重要数据,比如运动、深度和旋转等——对于训练机器人自行复制动作而言,这些数据非常重要。积累一定时长的数据后,它们会被用来与高效的学习算法相结合,训练模型,教会机器人如何完成家务 。

除了 OK-Robot,Pinto 和团队还开源过 Dobb-E ——也是使用从真实家庭收集的数据训练模型,机器人学会了打开空气炸锅、关门或拉直坐垫等家务。10 个纽约家庭中的 30 天测试结果发现,机器人完成了 109 项家务任务,总体成功率为 81% ,掌握新技能仅需 20 分钟。

图片

除了 Lerrel Pinto , Fauna Robotics 另一位创始人是 Rob Cpchran。Linkedin 资料显示,他是两天前入职公司,也是公司 CEO 。不过,一个月前就有消息披露这位前高盛董事总经理在高盛工作三年半后悄然离开,并创办了自己的机器人公司。

图片

加入高盛之前,Cochran 大部分职业生涯都在“互联网大厂”( FAANG )度过。在加入神经接口初创公司 CTRL-Labs 之前,他曾在亚马逊云做了三年产品经理。进入 CTRL-Labs后,他迅速从高级产品经理晋升为产品管理主管。2019年,CTRL-Labs 被 Facebook 收购,Cochran 继续在 Facebook 工作了八个月,然后去了高盛。Rob Cochran 曾是高盛工程部门的首席产品官。
Lerrel Pinto 之前接受媒体采访时曾说过,希望看到家庭中的机器人不仅可以做吸尘工作,还可以成为我们生活中更不可或缺的一部分,比如做家务、照顾老人等,在我们需要它的时候可以随时出现。他也希望有一天不必向机器人展示更多的例子,它就能学会新任务。
在一些机器人学者看来,Pinto 和团队的研究成果表明,家庭机器人的未来真的来了。这不再只是一些疯狂的梦想。“我们看到了一场机器学习革命,它让现在新创建的模型不仅在实验室中有效,而且在开放世界中也很好用。看到它们在真实的物理环境中确实有效,这是非常有用的信息。” 谷歌 DeepMind 高级计算机视觉研究科学家 Matthias Minderer 认为。
Pinto 希望加速机器人大型语言时刻的到来,帮助开启一个全新的 AI 时代。“一旦人们开始相信家用机器人是可能的,这个领域就会迎来有更多的成果。”
“有一种观点认为,行动是促使人类拥有大脑的原因。”他说,“进化首先是为了让我们生存下来,去寻找食物。”但他认为,“智能的终极目标是行动并改世界,我认为唯一能做到这一点的是物理生物,比如机器人。”
参考链接

https://www.mittrchina.com/news/detail/12945
https://www.linkedin.com/feed/update/urn:li:activity:7169399534568087553/
https://www.lerrelpinto.com/
https://www.technologyreview.com/2023/12/14/1085231/new-system-teach-robot-household-task/
https://www.efinancialcareers.com/news/goldman-sachs-technology-md-resigns-for-mysterious-robotics-venture
产业ChatGPT机器人技术
相关数据
DeepMind机构

DeepMind是一家英国的人工智能公司。公司创建于2010年,最初名称是DeepMind科技(DeepMind Technologies Limited),在2014年被谷歌收购。在2010年由杰米斯·哈萨比斯,谢恩·列格和穆斯塔法·苏莱曼成立创业公司。继AlphaGo之后,Google DeepMind首席执行官杰米斯·哈萨比斯表示将研究用人工智能与人类玩其他游戏,例如即时战略游戏《星际争霸II》(StarCraft II)。深度AI如果能直接使用在其他各种不同领域,除了未来能玩不同的游戏外,例如自动驾驶、投资顾问、音乐评论、甚至司法判决等等目前需要人脑才能处理的工作,基本上也可以直接使用相同的神经网上去学而习得与人类相同的思考力。

https://deepmind.com/
激光雷达技术

自动驾驶车辆传感器的一种,采用激光扫描和测距来建立车辆周围环境的详细三维模型。Lidar 图像具有高度准确性,这使得它可以与摄像头、超声波探测器和雷达等常规传感器相提并论。然而激光传感器面临体积过大的问题,同时,它的机械结构非常复杂。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

语言模型技术

语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。由于字词与句子都是任意组合的长度,因此在训练过的语言模型中会出现未曾出现的字串(资料稀疏的问题),也使得在语料库中估算字串的机率变得很困难,这也是要使用近似的平滑n元语法(N-gram)模型之原因。

推荐文章
暂无评论
暂无评论~