高洁作者

《人工智能之人机交互》报告重磅发布,展示AI+人机交互的酷炫现状与未来

导语

近日,由清华大学人工智能研究院、北京智源人工智能研究院和清华-中国工程知识智能联合研究中心编写的《人工智能人机交互》报告正式发布。该报告以人机交互技术为核心,在梳理了其概念定义和发展历程的基础上,重点研究了主要技术的发展情况、领域专家现状和应用领域,列举了必读论文,并探讨了人机交互未来发展趋势。人机交互(Human-Computer Interaction, HCI),是一门研究系统与用户之间的交互关系的学问。人机交互技术的发展与国民经济发展有着直接的联系,它是使信息技术融入社会,深入群体,达到广泛应用的技术门槛。在现代和未来的社会里,只要有人利用通信、计算机等信息处理技术进行社会活动,人机交互都是永恒的主题。

人机交互的发展历史,是从人适应计算机到计算机不断地适应人的发展史,交互的信息也由精确的输入输出信息变成非精确的输入输出信息。在过去的几十年间,人机界面经历了从命令行界面到图形用户界面两个主要发展阶段的演变;近年来,人机界面的发展越来越强调交互的自然性,即用户的交互行为与其生理和认知的习惯相吻合,随之出现的主要的交互界面形式为触摸交互界面和三维交互界面。

命令行界面
图形用户界面
触摸交互界面
三维交互界面
目前,人机交互技术主要发展方向包括以下几个类别:

-    触控技术

o   电阻式触控技术

o   电容式触控技术

o   红外触控技术

o   表面声波触控技术

电阻式触摸屏结构示意图
电容式触摸屏原理示意图
红外触摸屏原理示意图
表面声波式触摸屏原理示意图

-    声控交互

o   语音识别

o   语音合成

语音识别系统的主要模块
语音合成方法-    动作交互

o   手势识别

o   姿势识别

谷歌motion sense隔空切歌
-    眼动交互
不同注视位置触发示意图-    虚拟现实输入

o   实体键盘技术

o   虚拟键盘技术

o   新型输入技术

用户在虚拟现实中使用QWERTY实体键盘进行输入

(a) TipText;

(b) BiTipText

(a)PizzaText;

(b)RingText

-    多模态交互

-    信息无障碍中的智能交互技术

-    必读论文

针对以上各类技术,该报告进行了详细的方法原理介绍,并对其当前发展现状进行了总结。其中,报告对于信息无障碍交互技术进行了全方位的分析。考虑到这项技术对残障人士的巨大意义,国家对此也十分重视。但信息无障碍交互技术目前仍处于初步发展状态,面临诸多问题和挑战。不过,报告指出,有人工智能技术的加持,这项领域将会更好地适应用户的需求。

此外,该报告通过AMiner大数据平台对人机交互领域的顶级学术会议及期刊论文进行挖掘,选出h-index排名最靠前的2000位领域活跃学者,并分析了学者的分布等情况,介绍了部分该领域国内外知名度较高的活跃学者。

首先,学者分布地图对于进行学者调查、分析各地区竞争力现况尤为重要,下图为人机交互领域全球顶尖学者分布状况。地图根据学者当前就职机构地理位置进行绘制,其中颜色越深表示学者越集中。从全球角度来看,美国的东部人才最为集中,西欧也有较多的人才分布,少数的学者分布于亚洲东部,大洋洲、非洲、南美洲的学者稀少。

学者人才数量前五的国家如下图所示。可以看出,美国在人机交互领域的人才数量遥遥领先,英国次之,而中国学者数量排名第五。

从我国学者分布情况来看,京津地区在本领域的人才数量最多,随后是台湾、长三角和珠三角地区,相比之下,内陆地区的人才较为匮乏,这种分布与区位因素和经济水平情况不无关系。同时,通过观察中国周边国家的学者数量情况,特别是与日韩、东南亚等亚洲国家相比,中国在人机交互领域学者数量方面优势不大。

报告通过AMiner大数据平台分析了中国与其他国家在人机交互领域的合作情况。中国与其他国家近二十年在上述期刊/会议合作论文数量前五的关系如下图所示,从中可以看出中美合作的论文数遥遥领先,超过了与其他国家合作论文的总数,体现出中美在本领域的密切合作关系。

除了宏观的专家状况,该报告还选取了该领域部分国内外代表学者,简要介绍了其学术背景和研究方向。根据AMiner的数据,报告统计了近三年在研究选取的期刊和会议上发表论文数最多的100名学者及其论文发表数量。

落实到实际生活,报告列举了人机交互技术的几大应用领域,从大家熟悉的智能终端(如智能手机、平板电脑等),到新兴的教育和医学领域。通过总结分析人机交互技术在不同领域中的应用优势,该报告展现了这项技术的巨大潜能。

学生利用VR技术学习最后,报告通过Aminer的领域技术分析系统,基于超过2亿篇论文的数据进行深入挖掘,对技术趋势、国际趋势、机构趋势及学者趋势等方面进行分析。

在技术趋势方面,当前该领域的热点研究话题TOP10是:Virtual Reality、Augmented Reality、Social Media、Social Interaction、Interaction Design、Mobile Device、Social Network、Ubiquitous Computing、Mobile Phone、Interaction Technique。

在国家趋势方面,当前人机交互领域研究热度TOP10的国家分别是:United States、United Kingdom、Germany、Canada、China、Japan、South Korea、Australia、France、Netherlands。

在机构趋势方面,当前人机交互领域研究热度TOP10的机构分别是:Carnegie Mellon University、Washington College、University of California、Stanford University、University of Michigan、Massachusetts Institute of Technology、Georgia Institute of Technology、Cornell University、Seoul National University、Yonsei University

另外,该报告也包含了AI TIME第七期《论道人机交互VS智能》研讨会中几位嘉宾的主要观点。“AI TIME”science debate 是2019年由清华大学人工智能研究院长张钹院士、唐杰教授、李涓子教授等人联合发起,希望用辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。本次探讨中,参会嘉宾对于智能人机交互的定义、未来交互技术发展的挑战等重要问题发表了不同看法,呈现专家之间的辩论也是该报告的一大亮点。

AMiner学术头条
AMiner学术头条

AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。系统2006年上线,吸引了全球220个国家/地区800多万独立IP访问,数据下载量230万次,年度访问量1000万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。

https://www.aminer.cn/
专栏二维码
产业AI人工智能人机交互
相关数据
唐杰人物

唐杰是清华大学计算机系副教授。他以学术社交网络搜索系统Arnetminer而闻名,该系统于2006年3月推出,目前已吸引来自220个国家的2,766,356次独立IP访问。他的研究兴趣包括社交网络和数据挖掘。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

虚拟现实技术

虚拟现实,简称虚拟技术,也称虚拟环境,是利用电脑模拟产生一个三维空间的虚拟世界,提供用户关于视觉等感官的模拟,让用户感觉仿佛身历其境,可以及时、没有限制地观察三维空间内的事物。用户进行位置移动时,电脑可以立即进行复杂的运算,将精确的三维世界视频传回产生临场感。

语音合成技术

语音合成,又称文语转换(Text to Speech)技术,是将人类语音用人工的方式所产生,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

李涓子人物

李涓子,博士,清华大学长聘教授,博士生导师。中国中文信息学会语言与知识计算专委会主任。研究方向为知识工程、语义Web和文本挖掘。

推荐文章
暂无评论
暂无评论~