赵辰霞 排版王新凯编审吴玲竹编辑

人工智能可以预测女朋友什么时候生气吗?

在“某乎”上搜索 “女朋友生气”你会看到包括且不限于以下让男生们非常困惑的问题:

看来,女朋友生气还真是一件十分“危险”的事情。

如果我们能通过人工智能,洞察女朋友情绪的波动,提前预见未来几天内她的情绪变化趋势;同时能通过Al预设出女朋友的一些生气场景和日期,通过数据挖掘,Al模型、量化技术等,帮助男生们更好的进行恋爱决策,规避“直面女朋友生气”的危险;是不是想想都开心,想想都轻松?

那么,人工智能可以预测女朋友什么时候生气吗?从技术角度看,又该如何建立这个生气预测AI呢?

第一步:听懂女孩子的话

当然,与让AI听懂“自然语言”不同,我们要让AI能够听懂女朋友们的话,毕竟女孩子的话,往往都“话里有话”。

比如“我没事”是真的没事还是“再不来哄我你就完了”,“我去洗澡了”是真的去洗澡还是“我真是和你无话可说!”,并且女朋友们的生气还分为真生气和假生气,还分为瞬时生气和持续性生气。

那么,这就需要采集你女朋友的历史数据,包括生气和高兴的数据:内在因素、外在因素、潜在因素、持续时间、生气后果、缓和时间、缓和原因及缓和结果等大项的数据;然后再细分成无数的小项,例如,从表情到动作,从五官开始判断变化,头部及四肢会产生哪些特有的行为动作,言语上会说哪些话,对这些进行记录,提取话语中频率较高的词汇等。

通过将以上大项不断细化为小项,进行大量的记录,每过一段时间,你归纳、整理的历史数据就会更大,被你女朋友训练的Al分析能力也更强,并逐渐形成正循环。

第二步:构建女朋友生气预测模型

接下来,我们需要用Python构建女朋友生气的预测模型。目前,NLP中的表示方法一共有两大类,独热表示和分布式表示。

词的独热表示(one -hot representation)是将每一个词写成一个N维的向量,其中只有一个分量为1,其他为零。N代表的是现有语料库的词汇表的大小。这种方法被称为词的离散化表示,单离散表示有很大的缺点:维数灾难,内存占用大,速度慢。所以引出将词表示成一个定长的连续的稠密向量,词向量形式。

词的分布式表示(Distributed representation)是若干元素的连续表现形式,将词的语义分布式地存储在各个维度中,与之相反的是独热向量。基于分布假说的词表示方法,根据建模的不同,分布式表示主要可以分为三类:基于矩阵的分布表示、基于聚类的分布表示和基于神经网络的分布表示。

建立预测模型后,运用我们收集到的历史数据来训练模型,最后就可以使用这个模型来预测女朋友什么时候可能生气了。

真的可以识别人类情感变化吗?

当然可以。毕竟,情感分析是人工智能的一个重要发展方向。

情感分析(sentiment analysis)又称倾向性分析,意见抽取(Opinion extraction),情感挖掘(Sentiment mining),主观分析(Subjectivity analysis)等,是指用自然语言处理文本挖掘以及计算机语言学等方法来识别和提取原素材中的主观信息。
情感分析的理论知识。它也有两个分支。

AI 情绪识别主要通过两个方面:语言和表情。

语言:包括语气和文字

文字中的情感分析,很多公司已经研发出了相关产品,比如讯飞的情感分析(文本倾向性分析)系统,就是计算机判断人们的看法或评论是属于对事物的积极、消极或中性意见。

微信在最近的更新中,也强化了语音识别技术,将发送或接受到的语音消息转换为文字时,微信会智能转换为相应的表情,系统会根据语义和语气等关键元素,识别添加相应的情绪表情。

表情

表情分析是AI研究者近年来关注的重点。

Amazon Rekognition于2017年11月在官方博客上推出实时面部识别、图像文本识别功能支持以及改进的面部检测功能。2019年为Rekognition面部识别系统添加了新功能,包括识别人们的恐惧情绪和年龄范围。

Rekognition在情绪识别功能上,一共可以识别人们的7种情绪,包括快乐、悲伤、愤怒、惊讶、厌恶、平静和困惑。但其准确率依然不高,并不是因为目前AI识别技术有多大问题,而是因为人们往往“喜怒不形于色。”

麻省理工学院(MIT)的Affectiva实验室,他们开发出的AI表情识别系统目前已经收集了9,453,324种人类面孔表情,利用计算机视觉(CV)、语音分析、深度学习等技术提高准确率Affectiva建立了一个独特的数据库,该数据库包含在75个国家/地区拍摄的500万个视频或大约20亿个表达真实情感的真实人的面部框架。

当然,人是一种复杂的动物,表情有时候并不反映内心的真实想法。AI情绪分析当前仍处于发展阶段,还没办法达到人类可以将心比心的程度,但是随着研究的深入,数据库的不断细化与扩大,未来的事情谁知道呢?

参考链接:
https://blog.csdn.net/Jasminexjf/article/details/101160694
https://zh.wikipedia.org/wiki/文本情感分析
https://www.xfyun.cn/services/emotion-analysis
https://imotions.com/biosensor/fea-facial-expression-analysis/
AMiner学术头条
AMiner学术头条

AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。系统2006年上线,吸引了全球220个国家/地区800多万独立IP访问,数据下载量230万次,年度访问量1000万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。

https://www.aminer.cn/
专栏二维码
产业表情识别情感分析计算机视觉
相关数据
Amazon机构

亚马逊(英语:Amazon.com Inc.,NASDAQ:AMZN)是一家总部位于美国西雅图的跨国电子商务企业,业务起始于线上书店,不久之后商品走向多元化。目前是全球最大的互联网线上零售商之一,也是美国《财富》杂志2016年评选的全球最大500家公司的排行榜中的第44名。

https://www.amazon.com/
相关技术
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

维数灾难技术

维数灾难(英语:curse of dimensionality,又名维度的诅咒)是一个最早由理查德·贝尔曼(Richard E. Bellman)在考虑优化问题时首次提出来的术语,用来描述当(数学)空间维度增加时,分析和组织高维空间(通常有成百上千维),因体积指数增加而遇到各种问题场景。这样的难题在低维空间中不会遇到,如物理空间通常只用三维来建模。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

数据挖掘技术

数据挖掘(英语:data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

语料库技术

语料库一词在语言学上意指大量的文本,通常经过整理,具有既定格式与标记;事实上,语料库英文 "text corpus" 的涵意即为"body of text"。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

文本挖掘技术

文本挖掘有时也被称为文字探勘、文本数据挖掘等,大致相当于文字分析,一般指文本处理过程中产生高质量的信息。高质量的信息通常通过分类和预测来产生,如模式识别。文本挖掘通常涉及输入文本的处理过程,产生结构化数据,并最终评价和解释输出。'高品质'的文本挖掘通常是指某种组合的相关性,新颖性和趣味性。

聚类技术

将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。

语言学技术

每种人类语言都是知识和能力的复合体,语言的使用者能够相互交流,表达想法,假设,情感,欲望以及所有其他需要表达的事物。语言学是对这些知识体系各方面的研究:如何构建这样的知识体系,如何获取,如何在消息的制作和理解中使用它,它是如何随时间变化的?语言学家因此关注语言本质的一些特殊问题。比如: 所有人类语言都有哪些共同属性?语言如何不同,系统的差异程度如何,我们能否在差异中找到模式?孩子如何在短时间内获得如此完整的语言知识?语言随时间变化的方式有哪些,语言变化的局限性是什么?当我们产生和理解语言时,认知过程的本质是什么?语言学研究的就是这些最本质的问题。

量化技术

深度学习中的量化是指,用低位宽数字的神经网络近似使用了浮点数的神经网络的过程。

推荐文章
暂无评论
暂无评论~