自然语言处理领域的进展(六、七)讲者状态的分析与生成、结论与展望

本文译自:Julia Hirschberg, Christopher D. Manning. Advances in Natural Language Processing. Science Magazine 2015. vol. 349 no. 6245 (261-266). 译者:李盛秋、袁建华(哈工大SCIR硕士生)

讲者状态(Speaker State)的分析与生成

讲者状态[54],也叫作“私人状态”[55],包含了说话的人或写作的人的意见、思考、信仰、情绪以及其他的个人观点。在NLP领域,很多工作都在关注基于词法和语法的情感分析(即判断文本的正负倾向性)和确信程度判别(包括确信、不确信、中性。译注:即讲者对所表述事件的确定程度)。情感和确信程度构成了对待事件或命题的态度,其中情感的对象还可以是人、机构或是抽象概念。对文本中的情感和情绪的检测需要利用词法和句子级别的信息。情感可以由带有正面或负面倾向的词语来表达,例如“伤心”、“着急”、“困难”、“无助”都表达了负面倾向,而“舒服”、“重要”、“成功”、“有趣”等词则表达出了正面的情感。在线情感词典(例如Whissel’s Dictionary of Affect[56])、以及通过人工主观排序?(subject-ranked)得到的词典系统(例如Tausczik and Pennebaker’s LIWC(Linguistic Inquiry and Word Count)[57])可以用来评估文本中正面、负面情感。更复杂的情感分析方法还会寻找文本中情感的持有者(来源)与对象,例如是谁对某人、某个活动或某个概念持有正面情感[55]。

 

语音领域同样对语音中的正负面倾向有所研究,一般更关注积极和消极情绪的识别,主要利用声学及韵律信息。不过,如今更多的工作集中在判断出具体的情绪,例如Ekman的经典六类基本情绪(愤怒、反感、恐惧、高兴、悲伤和惊奇),这些情绪都可能是人们对事件、命题、或其他对象的反应。还有大量的研究使用一些已被证明在识别经典情绪任务上很重要的特征来判断讲者状态(例如是否存在欺诈)、健康状况(例如是否患有孤独症、帕金森综合征)、讲者特征(例如年龄、性别、魅力、病理、个性等)、讲者状态(例如认知负荷、是否醉酒、是否有困意、兴趣、确信程度等)。从2009年开始举办的Interspeech Paralinguistic Chanllenges提供了用于这些研究的语料库。情绪生成已经被证明了是要比语音合成更加困难的挑战。虽然已经有一些系统(例如MARY)尝试生成情绪语音,例如沮丧、敌对、高兴等[58],但是目前最好的合成情绪语音仍然是由那些声音模仿方面的高手模仿出来的。

 

情感分类在各个语言和领域中被广泛应用于观点识别任务(对于人物、机构或思想等的褒贬观点)。这样的应用很多,比如识别电影或产品评论的褒贬[59],[60]、利用国会记录预测投票情况[61]、从法庭记录来预测最高法院的判决等。图5描绘了一段比较典型的饭店评论,标注为正面、负面和中性情感,以及一些基本的情绪。

图5.人工标注的饭店评论分析样例

社交媒体中挖掘情感或经典情绪是目前比较火热的话题,例如利用Twitter估计“大众情绪”、预测股票市场趋势,或是简单估算一个社区的精神状态[62]。诸如Twitter、博客、论坛等形式的社交媒体同样给研究人员带来了大量的数据,用于研究情感和情绪在识别语言学、社会学现象(例如讽刺[63]、权利关系、社会影响[64])以及精神健康问题(例如抑郁症[65])任务上所起的作用。

结论与展望

过去五十年间,热情的研究人员曾多次过高地期望像科幻电影中机器人那般的语言理解能力很快会实现。但是事实上,那时的语音和语言理解效果不够好,不足以驱动主流的应用程序。不过在过去的五年中,形势发生了巨大的变化。语音识别效果的巨大提升使得对手机说话变得很常见,尤其对年轻人而言。Web搜索引擎在理解复杂查询任务上越来越成功,机器翻译尽管目前还不能产生人工质量的翻译结果,但是至少能给出另一个语言材料的大意。计算机系统基于对公司报导中的情感信息自动地进行股票和期货交易。结果就是,如今在对人类语言技术的有效利用上存在巨大的商业价值,尤其因为在与手机交互时自然语言提供了非常自然的交互界面。短期而言,我们有信心:更多的数据和计算,加上近来在机器学习和深度学习领域的技术进步,会促成自然语言处理长远、持续的发展。但是,解决真正困难的语义、上下文和知识的问题或许还需要在语言学和推理学科的新发现。从这个角度值得注意的是,语言的概率方法的开发不仅仅是去解决工程问题:语言的概率模型同样会反映回(been reflected back into)语言科学来。在那里,科研人员正不断发现重要的新应用来描述音韵学[66]、理解人类语言处理过程[67]和建模语言的语义及语用[68]。语言学的许多领域自身在方法上正变得更加具有实证性、也更加量化。

REFERENCES AND NOTES 

[54]. J.Liscombe, thesis, Columbia University (2007).

[55]. J. Wiebe, T. Wilson, C. Cardie, Lang. Resour. Eval. 39, 165–210 (2005).

[56]. C.Whissell, “The dictionary of affect in language,” in Emotion:

Theory,Research and Experience, R. Plutchik, H. Kellerman,

Eds.(Academic Press, London, 1989).

[57]. Y.R.Tausczik, J.W.Pennebaker, J.Lang.Soc.Psychol.29,24–54(2010).

[58]. O. Türk,M. Schröder, IEEE Trans. Audio Speech Lang. Proc. 18,

965–973(2010).

[59]. B. Pang, L. Lee, S. Vaithyanathan, “Thumbs up? Sentiment

classificationusing machine learning techniques,” in Proceedings of the 2002 Conference onEmpirical Methods in Natural Language Processing, Philadelphia, PA, July 2002(Association for Computational Linguistics, Stroudsburg, PA, 2002), vol. 10,pp. 79–86.

[60]. H. Wang, M. Ester, “A sentiment-aligned topic model for product aspect ratingprediction,” in Proceedings of the 2014 Conference on Empirical Methods inNatural Language Processing, Doha, Qatar, 25 to 29 October 2014 (Associationfor Computational Linguistics, Stroudsburg, PA, 2014), pp. 1192–1202.

[61]. M.Thomas, Bo Pang, L. Lee, “Get out the vote: Determining support or oppositionfrom Congressional floor-debate transcripts,” in Proceedings of the 2006Conference on Emprical Methods in Natural Language Processing, Sydney,Australia, 22 to 23 July 2006 (Association for Computational Linguistics,Stroudsburg, PA, 2006), pp. 327–335.

[62]. J. Bollen, H. Mao, A. Pepe, “Modeling public mood and emotion: Twitter sentiment andsocio-economic phenomena,” Proceedings of the Fifth International AAAIConference on Weblogs and Social Media, Barcelona, Spain, 17 to 21 July 2011(AAAI Press, Menlo Park, 2011), pp. 450–453.

[63]. R.Gonzalez-Ibanez, S. Muresan, N. Wacholder, “Identifying sarcasm in Twitter: Acloser look,” in Proceedings of the49th Annual Meeting of the Association forComputational Linguistics, Portland, Oregon, 19 to 24 June 2011 (Associationfor Computational Linguistics, Stroudsburg, PA, 2011), pp. 581–586.

[64]. O. Biran, S. Rosenthal, J. Andreas, K. McKeown, O. Rambow, “Detecting influencers inwritten online conversations,” in Proceedings of the 2012 Workshop on Languagein Social Media, Montreal, Canada, 7 June 2012 (Association for ComputationalLinguistics, Stroudsburg, PA, 2012), pp. 37–45.

[65]. L.-C. Yu, C.-Y. Ho, “Identifying emotion labelsfrom psychiatric social texts using independent component analysis,” inProceedings of COLING 2014 (Technical Papers, Association for ComputationalLinguistics, Stroudsburg, PA, 2014), pp. 837–847.

[66]. B. Hayes,Z. Londe, Phonology 23, 59–104 (2006).

[67]. R. Levy,Cognition 106, 1126–1177 (2008).

[68]. N. D.Goodman, D. Lassiter, “Probabilistic semantics and pragmatics:

Uncertainty in language and thought,” in Handbook ofContemporary Semantics, C. Fox, S. Lappin, Eds. (Blackwell, Hoboken, NJ, ed. 2,2015).

本文来源于哈工大SCIR

原文链接点击即可跳转

产业
返回顶部