我们收集了150份设计建议,整合成这份《人工智能交互指南》

编者按:随着人工智能技术的发展,越来越多的AI技术被应用于各类产品和服务中,这也为AI设计师带来了许多挑战。微软研究院的研究人员基于前人对搭建高效人工智能交互系统等相关问题的研究成果,整合成一份《人工智能交互指南》。该指南共分为四个板块,规定了交互初始阶段、用户与系统交互过程中、系统出错情况下以及随着时间推移,人工智能系统分别应该如何表现。这份指南不仅为AI设计师提供了具体、可操作的建议,还旨在推动用户体验和工程开发从业者就设计决策的相关问题展开讨论,推动这一领域研究的进步。本文编译自微软研究院博客文章“Guidelines for human-AI interaction design”。

AI的可用性和准确性日益提升,激发了面向用户的主流应用和服务采用AI技术的热潮,伴随着各种人工智能服务产品到来的,还有对以人为本设计的最佳实践方法和实践指南的挑战和质疑。为了满足这方面的需求,由微软研究人员组成的专门团队对一系列人工智能交互指南进行了整合与考证。对于面对的各种复杂局面,AI设计师急需一份最佳实践指引,而上述研究正是朝着这个方向迈出的重要一步。

为了整合包括预测、识别和自然语言理解等在内的人工智能服务,AI设计师需要思考许多新的问题,例如,交互设计人员必须解决人工智能系统推理失败与成功的几率问题,机器学习带来的系统行为改变问题,以及AI功能的可理解性和可控性问题。

当前AI设计本身存在多变性,而当用户无法有效理解或控制人工智能系统时(例如,半自动车辆事故),就会出现有关意外事件的大肆报道。这些都凸显了提供更直观、更有效的AI用户体验的重要意义。有关设计以人为本的人工智能系统的讨论从未间断,AI设计师也迫切希望得到可靠的相关设计指南。

在过去20年间,科学家和工程师提出了不少有关AI系统有效交互设计的指南和建议。内容涵盖用户预期管理、自主程度调节、歧义解决,以及帮助人们认识随着系统对用户的了解不断加深而可能发生的变化。不幸的是,这些设计建议多分散在不同的出版物中,而且很少作为指南明确提出。微软研究团队收集了150余份设计建议,对它们加以提炼和验证,最终整合成一份统一的指南,让AI设计人员都能够以现有知识为基础,不断向前发展。

“此前并没有一套针对人工智能直观交互系统的统一指南,而我们正着手创建这样一套指南,并对其加以验证,”负责《人工智能交互指南》开发项目的研究员Saleema Amershi说。

人工智能交互指南》(及其开发和验证流程)将在苏格兰格拉斯哥举行的2019年CHI大会上发布。团队成员Saleema Amershi、Dan Weld、Mihaela Vorvoreanu、Adam Fourney、Besmira Nushi、Penny Collisson、Jina Suh、Shamsi Iqbal、Paul Bennett、Kori Inkpen、Jaime Teevan、Ruth Kikin-Gil和Eric Horvitz对20多年来学术界和工业界在人工智能设计方面的认知和思考进行了整合,使之成为一套精炼而又具有普适性的人工智能交互设计指南。

这篇CHI 2019入选论文《人工智能交互指南》将各种涉及面广泛、内容具体的指南整合成一套可以被普遍接受的指南,同时也是对Eric Horvitz在CHI 1999上发表那篇开创性论文的20周年纪念。这篇论文提出了将人类和人工智能的能力有机结合,以及人工智能和人类混合动力的原则。

微软研究人员遵循严格的流程,首先收集了150多份与AI相关的来自权威来源的设计建议,包括学术研究论文、博客文章和一些内部资料。在对主题分类后,研究人员对内容进行了精简。然后,他们与用户体验(UX)和人机交互(HCI)专家联手,展开多轮评估,以确保这份指南易于理解,并且适用于各种流行的AI产品。

“我们希望确保指南的内容具体,并且能够在UI层面产生可观察的效果。因此,我们剔除了一些诸如‘设定期望’或‘建立信任’之类的总体原则,并将其转化为具体、可操作的指南”资深项目经理Mihaela Vorvoreanu说。

研究人员总结的18项人工智能交互指南共分为四个板块,规定了交互初始阶段、用户与系统交互过程中、系统出错情况下以及随着时间推移,人工智能系统分别应该如何表现。虽然《人工智能交互指南》旨在为设计决策提供支持,但它不是一份简单的检查清单,更是意在支持和推动用户体验和工程开发从业者就设计决策的相关问题展开对话,并推动该领域更深入的研究。作者也认识到,在很多情况下,AI设计师必须在各项指南之间做出取舍,权衡不同因素的重要性。但同时,不断丰富的AI产品功能和用例也需要更多的设计指导。

准则10:有疑问时调整服务范围。当Word中的“自动替换”功能对某项更正操作存疑时,它会显示多个选项供用户从中选择,以此消除歧义。

人工智能交互指南》的制定和验证以图形用户界面产品为依据,但也可以针对语音交互甚至半自动驾驶车辆等特殊的高风险用途加以具体化扩展或修改。

微软研究院院长Eric Horvitz表示:“我们仍处于利用人工智能技术扩展人类能力的早期阶段。未来还有很多机会,当然也面临着许多有趣的挑战。其中的一个重要方向就是分享和完善有关将AI功能集成到人机交互体验中的原则和设计。”

准则15:鼓励细化的反馈。

Ideas in Excel功能帮助用户通过高级的可视化总结、趋势图和模式图来理解数据。通过“这对您是否有帮助?”的提问,鼓励大家对Excel提供的每项建议给予反馈。

人工智能交互指南》的意义或许已经超越了AI设计范畴,延伸至对“负责任和值得信赖的人工智能”的讨论。在2018年11月,微软埃忒尔道德委员会(Aether Committee)发布了一份关于聊天机器人和虚拟助手等会话界面设计的指南——《负责任的机器人:对话AI开发者的10大指南》。该委员会由微软首席执行官萨提亚·纳德拉亲自宣布成立,专注于AI技术的负责任开发与应用等议题,以确保公司的AI研发工作符合微软的核心价值观和原则,并能够使整个社会受益。埃忒尔道德委员会下设几个专题工作组,Amershi担任人机交互与协作工作组的联合主席。

人工智能交互设计指南

以下是《人工智能交互设计指南》的内容摘要,想要了解各条指南的详细信息和示例,请点击“阅读原文”,参阅论文《人工智能交互指南》。

初始阶段

01. 明确系统可以做什么。

帮助用户了解AI系统能够做什么。

02. 明确系统的能力限度。

帮助用户了解AI系统的出错频率。

在互动期间

03. 基于情境为服务设定时间。

根据用户当前的任务和环境,设定执行或中断操作的时间。

04. 显示与用户使用情境相关的信息。

显示与用户当前任务和环境相关的信息。

05. 符合相关社会规范。

提供符合用户社会文化背景的体验。

06. 减少社会偏见。

确保AI系统的语言和行为不会强化刻板印象及偏见。

系统出错时

07. 支持高效的调用。

在需要时可以轻松调用或请求AI系统的服务。

08. 支持高效解除。

要能够轻松解除或忽略不需要的AI系统服务。

09. 支持有效的纠正。

当AI系统出错时,能够轻松编辑、优化或恢复。

10. 有疑问时调整服务范围。

如果不能确定用户的使用目的,调用消除歧义功能或减少AI系统的服务。

11. 明确解释系统为什么会这样做。

让用户能够访问AI系统行为的原因说明。

随着时间推移

12. 存储近期互动。

保留短期互动记录,并允许用户有效地查看这些记录。

13. 了解用户行为。

逐渐学习用户行为,实现用户体验的个性化。

14. 谨慎地更新和调整。

在更新和调整AI系统的行为时,尽量避免颠覆性的变化。

15. 鼓励细化的反馈。

在用户与AI系统的交互期间,鼓励用户提供反映其偏好的反馈。

16. 告知用户操作的后果。

提醒或告知用户他们的操作将如何影响AI系统之后的行为。

17. 为用户提供对AI系统的完全控制。

允许用户全权控制AI系统监控的内容及其行为方式。

18. 将变更信息告知用户。

当AI系统添加或更新功能时,通知用户。

微软研究院AI头条
微软研究院AI头条

专注科研19年,盛产黑科技

产业微软人机交互
2
相关数据
自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

自然语言理解技术

自然语言理解是人工智能的核心课题之一,也被广泛认为是最困难和最具标志性的任务。最经典的两个人工智能思想实验——图灵测试和中文房间,都是围绕自然语言理解来构建的。自然语言理解在人工智能技术体系中的重要性不言而喻,它一方面承载着机器和人的交流,另一方面直达知识和逻辑。自然语言理解也是人工智能学者孜孜以求的圣杯,机器学习的巨擘 Michael I. Jordan 就曾经在 Reddit 上的 AMA(Ask Me Anything)栏目中畅想用十亿美元建立一个专门用于自然语言理解的实验室。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

聊天机器人技术

聊天机器人是经由对话或文字进行交谈的计算机程序。能够模拟人类对话,通过图灵测试。 聊天机器人可用于实用的目的,如客户服务或资讯获取。有些聊天机器人会搭载自然语言处理系统,但大多简单的系统只会撷取输入的关键字,再从数据库中找寻最合适的应答句。

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

推荐文章
暂无评论
暂无评论~