Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

什么样的智能助手才是我们真正想要的?

其实我们无法接受人工智能和数字助手的原因很简单,一是“麻烦”,二是“尴尬”。

很多人都非常向往科幻作品中未来的日常生活场景 —— 人工智能尽心尽力服务人类,任何事情只要随便招呼一声,机器系统都会马上替你完成。当时我们觉得,这样的生活实在是太轻松,太炫酷了。不过当这样的技术 —— 人工智能和数字助手 —— 开始离我们越来越近的时候,大家倒是冷淡了起来。

科幻作品中的机器人形象:善解人意且无所不能

其实我们无法接受人工智能和数字助手的原因也很简单,一是“麻烦”,二是“尴尬”。

早前的计算机无法和人进行自然流畅的交流沟通,因此我们只能够用机器能理解的交互语言去让它听从我们的指令。从字符命令到键鼠在图形界面上的菜单操作,再到现在的触摸图标,都是如此。虽说是个不得已而为之的解决方案,但这种思路一直发展了那么多年,经过了无数次优化,人们不仅已经习惯了这种模式,而且十分享受它的精确和快速。

微软开发的的智能助手 Cortana

与此相比,语音助手需要你用尽可能规整的语言去告诉它该怎么做,它还有一定的反应时间,还要加上各种各样的出错可能性。那么,人们自然也就会喜欢“该是什么就是什么”的传统交互了。

即使在技术的发展下,出错率的问题得到了有效的控制,多数人也不会选择在公共场合中使用数字助手,其原因自然是因为“尴尬”了。想象一下现在饭局里一群人低头玩手机的场景,比起这个,大家七嘴八舌地对手机下指令似乎要诡异得多。即使是独身一人在家,肯定也有相当一部分人更喜欢默默进行操作,而非什么都要经过一遍自己的嘴。

业界的想法

微软全球副总裁沈向洋

微软全球执行副总裁,这个软件巨头在人工智能领域的领头人物沈向洋提出了一个有趣的观点:人工智能需要的是情感,它不是工具

这个说法可能会让人们联想到电影《机械公敌》里的那个机器人,但沈向洋口中的情感似乎还没有到那个地步。他表示,合格的人工智能助手在用户询问天气之后,给出的要不仅仅是具体的天气信息,它还应该能够提醒用户多穿衣服、带上伞。换句话说,人工智能要能理解人类的情感

沈向洋表示,人类之间的对话有一个特点是,并没有每一句话都有意义,在那些少数的任务性话语外,掺杂有许多许多的闲话和废话。微软希望的是在这种类似的闲聊中,通过一级一级的逐步分析来判断用户的情绪和他们真正的需求,然后完成任务。

Alpha Go 和李世石的人机大战

正因为有这样的野心,沈向洋并不掩饰自己对 AlphaGo 的“吐槽”。他表示,尽管 AlphaGo 的出现是一个了不起的成就,但它的作用太单一,很难有商业化前景。这位微软高管的意思自然不是指 AlphaGo 只会下围棋,而是说它仅仅是一种弱人工智能,只能凭借筛选过滤求最优解的能力进行大数据分析,而不能真正走进千万家。

我们想要的助手

正如上文所说,数字助手要能真正得到人们的喜爱,“自然”和“善解人意”是不可或缺的。Siri 团队核心成员离开苹果后开发了 Viv 助手,开发者表示它未来能够仅凭用户一句“我醉了”就知道主动叫车将他送回家。这,距离我们理想中的人工智能和数字助手开始接近了。

有一种所谓的“恐怖谷效应”,指的是当一个拟人物体变得越来越像人的时候,人类对它的好感度会突然从一个高点跌至感到诡异可怕的程度。拟人物体那种很像人但明显不是人的状态给人们带来难以言说的恐惧。这种理论挪用到数字助手领域,它现在那种试图模拟人类却一点都不自然的互动方式让人们感到无比生硬和别扭。与此相比,反倒是人去迁就机器的那种交互方式因为和人人交互完全不一样,不会给我们别扭的感觉。

恐怖谷理论:当机器人在外形上越接近人,人类越会觉得机器人恐怖

因此,数字助手需要做到的不仅仅只是听懂人类给它的清晰指令,它还需要学会理解人类的情绪,做到在人类那种特有的模糊混乱的表述方式里正确理解其需求,这样才能够达到初步被人类所接受的地步。

那么人工智能要尝试去理解的就不仅仅是话语了,还有用户的身体状态、姿势、步态、面部表情、语气等信息。此外,要理解人类一段话中的上下文联系,人工智能还需要去学习更多的人类对话,把握那些隐藏的东西。还有一点很重要,即使是人和人之间也不总是一直在用语言提出需求的,那么支持一定的文字输入、手势识别、隐蔽的小动作指令,这些都很重要。

未来可期

车载人工智能助理(概念图)

事实上沈向洋人工智能技术的发展相当乐观,他认为只需 5 年计算机就能获得比人类更全面的语言理解能力,只需 10 年其视觉处理能力就将胜过人类。

人工智能真的是计算平台的未来吗?

应该说答案是肯定的。事实上人类并不排斥和人工智能交流,否则微软小冰这个机器人在国内也就不会那么人气高涨了。在纯粹的“调戏”之外,我们也确实并不讨厌和具有一定信息处理和回馈能力的机器人交流。电影《钢铁侠》里斯塔克和智能管家贾维斯闲聊式的交互,只要技术能够做到这一点,那么尴尬生硬感就会消失 —— 哪怕对方其实本质上并不能明白你的情感,只是深度学习的体现。

可能会有人担忧人工智能给人类带来的威胁,因为没有感情的机器人会选择的完成任务的方式和人类预期的可能并不一样。关于这一点,我们就必须得把控好给予它们的权限范围。

本文转载自21IC电子网

原文:https://0x9.me/X4eiA

Naturali 奇点机智
Naturali 奇点机智

致力于让企业轻松创建语音交互体验,让对话与服务有效连接。语音对话平台“对话流”由奇点机智自主研发,利用其领先的语音识别、NLP、深度学习技术,为企业提供智能语音对话解决方案。

产业智能助手chatbot语音交互智能管家深度学习语音助手
相关数据
沈向洋人物

微软全球执行副总裁,美国工程院院士。

深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

弱人工智能技术

弱人工智能(weak AI),也被称为窄AI,是专注于某一特定狭窄领域任务的人工智能。 相对于可以用来解决通用问题的强(泛)人工智能,几乎目前所有的人工智能都属于弱人工智能的范畴I。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

阿尔法围棋技术

阿尔法围棋是于2014年开始由英国伦敦Google DeepMind公司开发的人工智能围棋程序。AlphaGo是第一个打败人类职业棋手的计算机程序,也是第一个打败围棋世界冠军的计算机程序,可以说是历史上最强的棋手。 技术上来说,AlphaGo的算法结合了机器学习(machine learning)和树搜索(tree search)技术,并使用了大量的人类、电脑的对弈来进行训练。AlphaGo使用蒙特卡洛树搜索(MCTS:Monte-Carlo Tree Search),以价值网络(value network)和策略网络(policy network)为指导,其中价值网络用于预测游戏的胜利者,策略网络用于选择下一步行动。价值网络和策略网络都是使用深度神经网络技术实现的,神经网络的输入是经过预处理的围棋面板的描述(description of Go board)。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

推荐文章
暂无评论
暂无评论~