venturebeat.com来源

能独当一面的家用机器人,什么时候才会出现?

人类社会的未来或许真的会印证著名科幻作家艾萨克 · 阿西莫夫的小说中那些奇妙的想象和预言,当然,指的是其中好的那些。关于未来世界广为人知的描述有很多,其中之一就包括机器人管家将无微不至的照顾我们的日常生活,比如如洗碗、叠衣服和遛狗。机器管家会照顾我们的孩子,取代护士和助理医师在诊所和医院中的角色,还会为每个人的三餐定制个性化的饮食计划。

毫无疑问这是个令人神往的前景,但首先要面对的严酷挑战是: 机器人如何学会自己解决问题?无法解决这个问题,我们就永远无法拥有像《杰森一家》中机器女佣萝西那样的机器人管家(译者注:《杰森一家》是著名动画剧集《摩登原始人》的未来版,描述了杰森一家在未来世界的生活)。目前大多数机器人严重依赖于启发式算法或是事前编码的程序来执行任务。Miso Robotic 公司推出过一款机器人叫Flippy,用于在加利福尼亚州帕萨迪纳的汉堡店来做肉饼烤制时的翻面工作,Flippy拥有远比一般工业机器人更为灵活的手臂,但比我们想象中的机器人管家差得还是太远。Flippy永远不会知道哄孩子上床睡觉首先该做什么,就好比它不会做蛋奶酥和蔬菜沙拉一样。

英伟达公司开发的人工智能系统SimOpt,向着实现真正的即插即用机器人迈出了坚实的一步——机器人能够在有限的基本知识或指令下自学技能。它利用强化学习——一种通过奖励(或惩罚)来驱使人工智能朝着目标前进的机器学习方法,让机器人把模拟进行的工作转化为在现实世界中实际行动,进而完成真正的工作任务。在相关研究中,脸书公司(Facebook)和加州大学伯克利分校(University of California,Berkeley)的人工智能科学家们利用强化学习得到的模型赋予了机器人"触觉",扩展了它们移动和操纵物体的能力。

即便是目前最前沿的强化学习技术也并不是特别灵光——比如,在英伟达的 FleX 物理模拟引擎中,训练 SimOpt 需要9600次两小时规模的模拟。但是随着分布式计算的普及,不难想象时长将会大大缩短。在算力强大的云计算人工智能加速器上可以针对特定的场景来做模拟(例如切菜),直到精度达到最低要求,然后将所得的算法转移到现实世界的机器上。通过这种方式,机器人将会迅速的掌握全新技能。

监督式学习是另一种机器学习的方法,监督式学习和强化学习结合的技术势头很猛,它包括通过代理任务,使人工智能能够自主学习,从而达到与监督学习模型相当甚至更好的准确性,而且所需步骤更少。类似的,另一种机器学习方法迁移学习也是如此,迁移学习可以把前一个任务算法用于解决下一个问题,打个比方,如果一个人学会了骑自行车,那么他就可以套用经验来学会开摩托车。

最近,由普林斯顿大学、哥伦比亚大学和谷歌组成的团队印证了将多种技术结合起来的强大力量。团队开发了一款名为TossingBot 的机器人,TossingBot可以学习如何抓取物体并把它们扔进盒子里。 经过14个小时的10000次抓握和投掷尝试后,TossingBot 从一堆杂物中准确抓取目标物品的成功率达到了87%

需要清醒的意识到,无论是使用强化学习迁移学习、半监督学习或是其他什么机器学习方法,即使是目前最复杂的机器人系统,也远远不及人类婴儿的能力。除了机械的限制,机器学习都是以(具体)任务为导向的,正如前文所提到的,机器人做不到举一反三,更别提多才多能了。

越来越多的研究机构展开了对非监督式学习的研究,一些专家坚信这是实现人工智能具备真正自主性的关键,拿对象排序问题来举例,就可以将无监督的数据收集与人工干预结合起来。就其本身而言,Facebook 正在利用部分的无监督强化学习来训练人工智能通过重复模拟而不是针对特定任务的模拟来学习技能,但目前还只是很初步的研究。

讲了这么多,就是想指出现实生活中还不太可能用上科幻世界中那样的机器人。撇开单位经济效益不谈,距离造出功能强大的机器人依然存在巨大障碍。 顽强的研究人员不会就此放弃,他们的工作无疑将在制造业中产出累累硕果。 不过在短期内,就不要指望你的下一个快递会由机器人送上门并且还和你聊上那么几句了。

参考资料

[1]https://venturebeat.com/2019/05/24/ai-weekly-truly-autonomous-home-robots-arent-within-sight-yet/

药明康德AI
药明康德AI

药明康德微信团队专业打造。当人工智能遇上大健康,带你看全AI时代的智慧之光。

专栏二维码
产业机器人
1
相关数据
半监督学习技术

半监督学习属于无监督学习(没有任何标记的训练数据)和监督学习(完全标记的训练数据)之间。许多机器学习研究人员发现,将未标记数据与少量标记数据结合使用可以显着提高学习准确性。对于学习问题的标记数据的获取通常需要熟练的人类代理(例如转录音频片段)或物理实验(例如,确定蛋白质的3D结构或确定在特定位置处是否存在油)。因此与标签处理相关的成本可能使得完全标注的训练集不可行,而获取未标记的数据相对便宜。在这种情况下,半监督学习可能具有很大的实用价值。半监督学习对机器学习也是理论上的兴趣,也是人类学习的典范。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

云计算技术

云计算(英语:cloud computing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备。

监督学习技术

监督式学习(Supervised learning),是机器学习中的一个方法,可以由标记好的训练集中学到或建立一个模式(函数 / learning model),并依此模式推测新的实例。训练集是由一系列的训练范例组成,每个训练范例则由输入对象(通常是向量)和预期输出所组成。函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类)。

工业机器人技术

工业机器人是面向工业加工制造的可自动控制,多用途,需有三轴及以上可编程的固定或可移动机械手。其系统中包括带有执行机构的机械手以及示教控制器。 它可以依靠自身控制能力来执行预设的轨迹及动作。典型应用包括焊接,刷漆,组装,采集和放置等工作。工业机器人完成工作具有高效性,持久性和准确性。目前常用的工业机器人包括关节机器人,SCARA机器人,并联机器人和直角坐标机器人等。

迁移学习技术

迁移学习是一种机器学习方法,就是把为任务 A 开发的模型作为初始点,重新使用在为任务 B 开发模型的过程中。迁移学习是通过从已学习的相关任务中转移知识来改进学习的新任务,虽然大多数机器学习算法都是为了解决单个任务而设计的,但是促进迁移学习的算法的开发是机器学习社区持续关注的话题。 迁移学习对人类来说很常见,例如,我们可能会发现学习识别苹果可能有助于识别梨,或者学习弹奏电子琴可能有助于学习钢琴。

分布式计算技术技术

在计算机科学中,分布式计算,又译为分散式運算。这个研究领域,主要研究分布式系统如何进行计算。分布式系统是一组电脑,通过网络相互链接传递消息与通信后并协调它们的行为而形成的系统。组件之间彼此进行交互以实现一个共同的目标。

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

加州大学伯克利分校机构

加利福尼亚大学伯克利分校,简称加州大学伯克利分校,又常被译为加利福尼亚大学伯克莱分校,位于美国加利福尼亚州旧金山湾区伯克利市,是一所世界著名的公立研究型大学。其许多科系位于全球大学排行前十名,是世界上最负盛名的大学之一,常被誉为美国乃至世界最顶尖的公立大学。

https://www.berkeley.edu/
推荐文章
暂无评论
暂无评论~