Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

隐形计算,让你的生活更智能

科技旨在让我们的生活变得更加简单,但事实上,它却总是让生活变得特别复杂。如何解决这个问题呢?答案很简单,隐形计算。

在朋友家吃着披萨、喝着红酒、看着电影。想想看如果用智能手机,你会如何做上述事情?打开订餐的app预定晚餐,在Hello Vino上选一瓶合适的红酒,到Yelp上找到卖红酒店家的地址,同时打开Waze导航避免遇上严重的堵车。一切妥当之后,你或许想要按下一个视频服务来选择一部电影。

这是五个独立的app应用和五个单独的步骤来完成披萨之夜这么简单的任务。我们生活之中需要完成更多的事情,而它们实际上远比一个披萨之夜要复杂。有数百个app都可以设计用来帮助我们完成生活中每一件细小的事情。但是在追求简单化的过程中,我们实际上却让生活变得更加复杂。

我们需要一个根本的解决方式,需要一种方法构造情景感知机器在动态情境中给我们最好的答案。我们想要诸如电影《星际迷航》或者《她》中看到过的电脑,帮助我们完成各种任务,从简单到复杂,同时还能在与人类交互过程中学习改变。我们需要隐形计算机,是无须计算机的计算方式。为了达到这一目的,我们必须设计一种全新的用户体验,行为像人类一样,在我们身边隐形地运作。

隐形的机器

追求简单化的过程中,我们却把生活变得更为复杂。

当今,基于屏显的设备在我们的计算体验中占据了绝对优势。它们都是不太灵便的机器,不停地催促我们为他们充电,在用餐的时候打断我们,并且占用我们口袋里的空间,我们桌面的空间,或者墙上的空间。尽管如此,我们还是一再容忍它们,因为其让我们的沟通更加简单,并且给我们提供大量信息。但它们仍然不是隐形的,不久的将来,感谢迄今已出现的技术能使得新兴轻量级交互成为现实,这些机器将会打破传统方式,让计算成为生活中更自然的一部分,如下四种交互方式为将来的隐形计算铺平了道路:

语音控制

长期以来,与计算机交谈都被认为是天方夜谭,这是其中一个更加接近真正人机交互的试金石。时至今日,与电脑交谈已经成为了老生常谈:Siri成为了苹果产品生态圈一个不可或缺的部分,亚马逊的语音控制个人助理Echo是其黑色星期五100美金以上商品销量最好的设备,市场上甚至有可以聊天的芭比娃娃,语音很快就变成了现代智能系统中不可或缺的部分——允许我们发出特别指令并将其他有着细微差别的输入模式进行分层。

但即使是一个完美的语音系统,与人类助手一样好,也永远无法取代所有的输入形式。如果指令要求精确或足够复杂的时候,命令人做某些事通常也不会很快、很方便或很精确,更何况命令机器。其中一部分挑战来自于用户,我们大部分人都不能做出如我们在按钮和命令之间选择那样快速的连续指令。同样的,无论语音技术多么发达,环境噪音的挑战以及社会礼仪会持续让打字成为重要的输入形式。

抬起头,解放双手

对于隐形计算机,我们需要的不仅仅是触屏。触屏、键盘和鼠标并未离我们远去,只是在未来计算发展中越来越无足轻重。尽管原本的WIMP模式(Window、Mouse、Pointer ,窗口、鼠标、指针)仍是像建立电子表格,做幻灯片演示一类高保真、高密度任务的基本模式,但这种模式在你试着按照一份菜谱烹饪时显得远远不够。你的笔记本电脑,平板电脑或智能手机或许是很方便的工具,但试想你揉着面,手指沾满面糊时想向下滚动屏幕的情景。我们需要新的人机交互模式,解放双手,只需要目光来协调任务。

我们周围的世界成了用户界面,呼之即来,挥之即去。

进入增强现实(AR)。增强现实是让我们在增强自身能力的同时仍沉浸在世界中,而不强迫我们管理设备。但最初的体验版本不会是科幻电影里看到的那样(电影《终结者》中拥有计算机渲染视觉和信息的植入显示器可以增强我们的视觉能力),至少不会很快出现。虽然这种技术将产生深远的影响,我们尚未解决戴着笨重AR眼镜所带来的不良影响。面对「眼睛是心灵的窗户」这一普世真理,如何更好地佩戴这样的设备仍将是一项艰巨的挑战。

我们可以利用一些更可行的方法把计算机影像投射到我们周围一些物体表面上,例如家里、办公室和公共场合的桌面、墙壁和地板上,来接近增强现实的效果。如果这样的系统获得了广泛应用,我们不用拿着机器也能与计算机交互。这意味着我们可以一边手忙脚乱地烹饪,一边与计算机交互来让它帮忙;意味着人们将自己的投影投射到一个桌面上共同合作;意味着任何自然表面都可以成为屏幕,有求必应,呼之即来挥之即去。过去几年,Jared Ficklin 和我先后在Frog和Argodesign上探究这一设想的可行性。你可以看看我们的原型:

http://v.qq.com/page/y/p/8/y0180p1u2p8.html

计算机协作

鉴于在工作场所的合作是如此重要,甚为惊奇的是,我们拥有的面对面共享的计算解决方案如此之少。现如今我们在以一种非常直接的方式体验计算——人手一机。这使得设计、销售和使用计算机非常简单,但也非常受限。如果你想要问计算机一个问题,无论是在与友人聊天还是在驾驶中,你需要一台计算机在你面前。你必须得有机器、APP和网络才能做事儿。

想象一下,在你家里,或车里,或办公室,有一台灵活且包罗万象,由你周边所有可用计算机构成的「虚拟机」。这些计算机将根据现时所需,协同工作为你服务。这种模式对办公室是理想化的,因为通常在办公中,参加会议的人需要去会议室,需要笔记本电脑、手机、手表以及固定的硬件,如天花板投影仪和会议系统的协助,而目前这些设备的操作基本是相互间完全独立的。设想这些机器能意识到上下文,便可以协作以精确记录会议,识别每一位发言者,并把记录转换成详细逐条的会议笔记。这些笔记作为会议的关键文件,可以被自动并安全地共享给与会者。像这样的一个环境系统,可以重新建立不只是正式会议,还有非正式交流的社会动态和价值。

想象你家有一台灵活且包罗万象,由你周边所有可用的计算机构成的「虚拟机」。

这一基本概念并不是新生的。早期Unix被设计成在桌上的键盘和屏幕,关键的CPU单独在一个房间,内存在另一个房间。但当个人电脑把这些元素揉在一起时,这个把电脑硬件分开的想法便过时了,更别提像文字处理、电子表格和电子邮件一类办公任务的整合。今天我们以计算机界面的新思维重新审视这个老旧的概念。今天我们的笔记本电脑,手机和手表的无缝互动,共享云服务,带给我们的极致体验。当我们开发明日的「隐形计算」时,我们可以把这种「云思维」拓展到用户界面,并且在每位用户的可及范围和许可下,以不断增加的机器构成庞大的虚拟实体。

全世界都是你的界面

我曾经写过一个关于让「非智能物品」融入我们的世界的概念,比如光控开关、门把手、盐瓶等,那些迎合我们需要的计算机智能。

3054733-inline-collaborationdesmond-the-new-story-of-computing-invisible-and-smarter-than-you

为什么我们需要一个智能盐瓶呢?被大肆吹嘘的物联网(Internet of Things, IOT)——每样东西都充满了高速计算和通讯的华丽新世界——的一个主要障碍是,它需要增加大量相应的设备,同时伴随着在计算机处理、网络设备和能源的扩张。类似于云计算将昂贵而复杂的电脑集中到了服务器群组,智能-普通物品(Smart-Dumb Things, SDT)的概念,将利用更少的集中资源,给我们的生活带来一个更实用的物联网。

在你想象《美女与野兽》中会说话的烛台之前,让我们更详细的解释一下。现有智能家庭的概念,需要对灯光、开关、温度和声音的远程控制。即使是一个房间内的简单装置,也需要三到四个独立的设备,每个设备都有自己的能源、管理和网络需求。相反,我们的SDT世界将在房间中心安置一个单一的设备。这个利用计算机来观察的隐藏设备,将会通过调试过的界面或物体来「观察」房间,实现人机交互,并将交流的内容翻译成所有与智能家庭相关的行动。普通电灯开关能被训练成智能开关。甚至散落在房间任何地方的图纸也能被训练成智能控制元件,或一个随机的物品,如盐瓶能被变成家庭立体声音响的音量开关。我们周围的世界成了我们的用户界面,呼之即来,挥之即去。

(更)聪明的机器

轻量级界面的增加并不能让计算更简单。我们需要人工智能来完成这个拼图。

能像人类一样思考和行动的「有感觉的机器」这种说法,歪曲了对人工智能的期望。那遥远未来的可能性,不应让我们从现在发展的真实技术中分心。在argodesign,我曾与Cognitive Scale公司一起工作,发展认知计算机的用户界面以帮助人们完成复杂的任务。这些系统能识别出复杂数据中的模式,将其调整为身边的语境,用浅显的英语提供可靠的建议,并代表你做决定。随着与你共同工作时间的增加,它们的能力也会不断提高。

当我们重新设计电脑,我们必须让思想超越键盘和屏幕。

在卫生保健等行业,更好的数据处理和制定决策将节省巨大开支,这类电脑就像一位虚拟合作伙伴,它的能力,是单独的人类或单独的机器都无法做到的。想象大医院的一名医生,他的认知计算机能自主的将地区花粉含量水平与病人的医疗记录相联系,辨认出哪些人更容易得哮喘。计算机会给高风险病人的智能手机发送信息,提供如何避免暴露与花粉中的个性化建议,还会通知相应的急诊室,他们可能会接收哮喘病人。这不是科幻小说。相反,这是今天计算机科学中最激动人心和意义深远的改变。

与需要人类专门集中输入的传统计算不同,认知系统能通过参与自然对话、理解语境和假定我们认为有用的结论而节省时间。不再是执行清楚的命令内容,这个系统将能代替我们寻找信息,并给出自己的建议。此外,它的目的是挖掘其工作经历以便随着时间的推移来给出更好的建议。

关于提示的一切

要达到这个目标需要一种全新的计算机交互方式——一系列人机交互的新方法。比如说,我们都可以理解屏幕上的那个小小垃圾桶是删除键。但是在我们重新发明计算机的过程中,我们的思考方式需要超越键盘和屏幕。可以轻易想象到我们将用什么方式发布指令:声音、手势、触摸对于人类来说都是本能的反应。但是电脑需要做出什么反应呢?它的反应须足够情景化、敏感、细微,使得可以在不打扰我们的情况下为手头上的任务提供帮助。

这一现象已经在进行中了。现在大量的通知声、轻敲声以及弹出对话框形成了丰富的语义内容。这些线索模拟原始的人类信号,又称「交际表达」——眨眼、点头或耸肩——在不打断的同时促进交流,而我们的电脑需要持续打断我们来询问。这些新的语义提示会逐渐成为人机交互全新语言中的一部分。

如今当我们被电脑打断后,我们很可能会从其他人那里获取系统信号或消息。同样地,当我们使用电脑去搜索在线信息时,机器也会去提取他人创造的内容。在这种方式下,你能搜索到信息的类别和准确度局限于他人创造的内容。但是认知系统可以极大的改变这一局面。它们可以为你省下冗长的搜索结果,并且计算出准确的答案或假设。当电脑开始传递此类含有丰富信息的交流时,我们会在几个方面受到挑战。

在涉及到复杂的想法时,我们对电脑的期待会比较低。

如今在处理复杂问题时,我们对计算机结果的质量和准确性通常只有较低的期望。这甚至体现在我们描述它的方式上。我们不会说电脑在「思考」问题,而是称之为「搜索」;电脑给我们传递「结果」,而不是「答案」。我们依然需要在诸多结果中筛选出正确的答案。当我们开始依赖于认知系统为我们提供更准确的答案时,这个负担落在了软件身上,去「证明」它是如何得出这个结论的——从而获得我们的信任。比如说,一名医生需要非常信任她的认知电脑才能依赖它的判断为病人制定治疗方案。

问题在于,要如何使电脑能够建立起其信用?人类通过语言来表达信心:「可能会下雨」或者「航班可能会延误」。我们还会采用对话的形式来验证假设:「你是怎么知道的?」认知电脑是否可以使用什么视觉提示或语言方法来表达其自信程度?

当一个机器(而不是人类)已经得出结论并且给出了一系列指标的数据,那么它需要一个新的显示界面。伴随着许多像Cognitive Scale这样的以数据为中心科技用户,我们正在开发新的交互方式来应对这一挑战。我们已经开发了能同时传递信息和表达信心的交互界面。这种反馈方式影响着实际信息的措辞方式(「我们相信X是正确的」或者「看上去X似乎是正确的」)以及「信心尺度」这种二级提示,能帮助用户明白这个系统不再是简单的黑白世界。

实际上一切都关于解码人类思考和沟通的方式。

认知系统需要天然、快速、直觉方法来建立信任。当你这样思考这件事情时,它其实是关于解码人类是如何思考和沟通的。我们已经对一个人如何做出决策有了充分的了解,甚至是最琐碎的决策——比如说中午要吃什么。我们的任务是帮助认知系统成为人们在情景中做出决策时值得信赖的帮手。

让计算机个性化

还记得上世纪90年代微软视窗助手 Clippy吗?当你使用Windows时,它每隔几分钟就会发出提示声给你提供一些帮助不怎么大的建议。Clippy是一个巨大的失败,因为它尝试用人类的方式与我们建立起密切联系,但却没有我们所期望的真正人类特性。上世纪70年代,机器人专家Masahiro Mori在观察人们对模拟人类特征的反感时提出来「恐怖谷」理论。我们与电视中的卡通人物相处融洽,但现实世界中的机器人却让我们毛骨悚然。原因是在生物学中对真正人类行为和方式的深度亲和力进行了编码。在我们对认知系统的反应也能看到同样的现象。一方面,我们想要这些系统在与我们建立联系时有更多的人性。相反,当它们错误时我们会拒绝它们。随着计算从生硬的工具到智能系统转变,这也许是我们面临的最深刻的用户界面设计挑战。

如今大部分软件协议都不是个性化的。机器不了解我们,它的反应能力相对固定。例如,如果我用Google Maps搜索从家到公司的路线,我很可能每次都得到相同的答案——无论交通状况是否在不断变化。

认知计算系统被设计成从用户那里学习,所以这些机器可以随着时间发展做出更精确的反应。每一次它面临一个新的抽象概念而它没法对这些抽象概念做出解释,它必须做两件事。首先,它将运行一个软件算法——一个概率训练——想出最好的猜测。然后,它需要人类做一个简单输入。

我们都有习惯和喜好,且我们想要教会机器去适应我们。例如,如果你的私人助理打断了一个重要的电话,告知说你的配偶在另一条线上,也许下次遇到这种情况你会让助理发个短信。你也要这样来训练你的电脑,让它知道如果必要,要何时以及如何通知你或者打断你。

我们必须制定教育机器的方式,决定它怎样承认自己的无知,然后赋予它能力去弥补这些知识的差距。我们必须教会它们什么时候向我们报告一些事情,什么时候要记住和忘记一些事情。这些「教育时刻」会很自然地发生。回到文章开头的比萨、酒和电影的轶事,想象一下你并没有安装所有这些APP,而是手机上有一个认知计算机程序。它会识别出比萨店是否营业,是否会在附近派送,大众评价是否良好。如果你选择了确定的比萨店地址,它下次会记住。它会与你的酒、电影、交通和购物选择偏好相关联,这样你的夜晚的娱乐活动就会少很多步骤了。

我们的计算经验总有一天会像法国童话中的大鼻子情圣,躲在灌木丛中,给不幸的基督徒提供完美的情书,让其去追求自己的梦中情人。

认知计算作为具有隐形接口的优雅伙伴,下一步就是创造一个更加无缝衔接的优雅产品、服务和经验。作为消费者,我们越来越需要以更便捷的方式来处理诸如点菜和打车等日常事务。作为专业人士,我们需要这样的工具来帮助我们表现更完美。最让人爱不释手的产品是:我们可以随手完成任务,但不会意识到让这一切毫不费力的背后技术。

我希望世界科技巨头都能致力于研究这项技术。不管怎样,世界需要一个标志性爆发点,iPhone勉强称得上,来阐明下一代计算的前景。实现这一愿景所需的原始计算能力与大量数据已经准备就绪,所面临的挑战是把这些片段与我们可倚赖和教育的计算放在一起,我们人类能与计算无缝、自然地建立起紧密关系。我们的计算总有一天会像法国童话中的大鼻子情圣,躲在灌木丛中,给不幸的基督徒送上完美的情书,让其去追求自己的梦中情人。不难想象这样的计算机充当我们的情感专家(甚至不止于此),可以连接各个点来帮助我们简化复杂的生活。

本文选自fastcodesign,作者:Mark Rolston,机器之心编译出品,参与:郑劳蕾、范娜fiona、Angulia、小樱、曾天宇、孟婷。

入门人工智能应用计算机人工助理
暂无评论
暂无评论~