5 月 28 日,机器之心主办的为期两天的全球机器智能峰会(GMIS 2017)进入第二天,全天议程中最受关注的是多位重要嘉宾出席的领袖峰会,包括《人工智能:一种现代方法》的作者 Stuart Russell、第四范式联合创始人兼首席科学家杨强、科大讯飞执行总裁兼消费者事业群总裁胡郁、阿尔伯塔大学教授及计算机围棋顶级专家Martin Müller、Element AI 联合创始人 Jean-Sebastien Cournoyer 等。
下午,竹间智能科技创始人、CEO简仁贤发表了主题为《人机对话 从猜测、概率到理解 》的演讲,以下是该演讲的精要摘录:
AI对语言理解的实质是什么?
层次一:关键词。即系统会对词进行理解和匹配(如TF-IDF方法),我们希望其找出单词到底是什么意思,这个是最浅层次的。
层次二:结合上下文(即所谓的语境和情境),我们希望系统能通过贯穿上下文贯,而让整个对话都能变得流畅。
层次三:能够理解对话的言外之意。这是一种情感情绪的理解,其在交互过程当中是相当重要的,无情感就不理解。
自然语言理解是整个交互过程、对话过程当中最重要的,自然语言理解应该要避免两个问题:
第一个问题:通过具有概率性的对话(众多的语料、大量的数据)进行预测。即根据词跟词之间出现的频率、句跟句之间出现的频率,来做概率的猜测。语言学的结构是无法迁移到这样一个模型的。
第二个问题:不懂语意的模式识别。
四个方向解决以上两个问题:
第一个方向:符号主义和连接主义的合作统一。其实在以前的NLP时代里,常常会有语言学的说我们不需要深度学习,只需要了解语言结构。而等我们有了数据、有了运算力、有了算法之后,我们却排除掉了语言学的结构和语法结构,只专注于深度学习。
第二个方向:从静态分析走向交互。做语言理解和处理与图象处理本身并不一样,图象本身是静态的,而对话是一个动态的过程。
第三个方向:从前层语意走向深层语意。没有理解意图、情绪情感是无法理解深层语义的。
第四个方向:从功能主义走向认知和情感体验。我们太专注于概率计算,而没有去真正理解语境跟情境。
人机交互要做到双向,必须要有三个结构。
第一,理解。
第二,决策。
第三,反馈。
理解是最重要的,如果不理解,决策一定会错。如果不理解,反馈也会错。系统能理解有两个非常重大的因素:
第一,意图的理解。
第二,情感程序的理解。
所以理解是最重要,最基础的。
其实对话只是一个开端,终点是能够用来服务用户、人群、商业。对话在垂直领域其实有三个阶段,我们在做落地当中总结了一些经验,主要有三个阶段。
第一,集成。商业跟人的沟通是通过APP采用命令式的语句。
第二,对话交互。竹间智能现在正从第二个阶段出发,往第三个阶段走。
第三,多任务处理阶段。除了交互之外,能不能有其他的方式,这是我们进步的方向。
简仁贤最后表明,语音不是交互,语言才是交互,语音是感知、感知、感官,而语言才是交互。它希望与大家来共同推广一个认知,即语言的交互、对话交互、语义的理解将是一个产业。