Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

2019开年拿下“一血” 百度摘得国际语义评测比赛冠军桂冠

国际赛事上屡传佳报的百度,2019年开年再次拿下“一血”。2019年2月1日,第十三届国际语义评测比赛(International Workshop on Semantic Evaluation, SemEval 2019)落下帷幕。在论坛评论建议挖掘任务评测(Task 9A: Suggestion Mining from Online Reviews and Forums)中,百度一举击败来自全球的210余支队伍,最终以F值78.12%的成绩夺得冠军,表明了百度率先在评论建议挖掘领域尝试并取得喜人的成果。

SemEval-2019 Task 9A 最终榜单,百度排名第一

SemEval评测是自然语言处理领域的国际权威竞赛,由国际计算语言学协会(Association for Computational Linguistics, ACL)下属的SIGLEX主办。ACL是自然语言处理与计算语言学领域最高级别的学术会议,是世界上影响力最大、最具活力的国际学术组织。自2001年起,SemEval至今已成功举办十二届,吸引了世界范围内的多所大学和研究机构的参加,在业界和学术界具有极高影响力。本次评测聚焦的任务是论坛评论建议挖掘,旨在抽取从网络论坛或评论中自动识别建议性的句子,用于帮助企业、政府机关等组织持续不断的从海量数据中提取有价值的信息。

如今,用户喜欢在网络中发表评论,表达自己对个人、产品、服务和社会事件等的意见和想法,这些评论不仅蕴含用户丰富的情感表达,有些还包含着用户对产品或服务的建议。比如“我喜欢吃这家餐厅”是用户表达喜欢这种情感的评论,但在“我喜欢吃这家餐厅,如果环境再好一点就更好了”这条评论中,还包含了用户对这家餐厅的建议。以往的情感分析研究更关注用户是否存在负面情感,上述这条评论往往会被忽略,实际上建议类评论对提升企业服务具有极高价值。目前,业界有大量针对用户情感分析的研究,但建议挖掘还处于初步阶段,百度率先在评论建议挖掘领域尝试。

建议挖掘是一项新的研究任务,该任务需要综合考虑句子的语义、语态、 情绪、句式、上下文等信息,才能做出准确的判断。例如“可以考虑在节假日增加几趟航班”,“假如房间里提供热水壶,我下次还愿意订在这里”等句子虽然句式、形态、评论的对象完全不同,但都是有价值的建议。对“建议”内涵和外延的理解存在比较大的主观性,使得问题定义及语料标注难以取得一致,这给建议挖掘带来了很多困难。

此次比赛中,百度团队采用多种技术手段解决难题,并最终取得了亮眼成果。首先,针对任务标注数据过于稀疏的问题,团队构建了以大规模无监督数据为基础的跨领域、多句式深度语义分类模型。采用融合浅层学习和深度学习的Ensemble学习模型,以解决样本不平衡问题。面对网络文本形式多样、表达不规范的现状,团队采用精细化粒度特征和注意力迁移机制进行处理。最终,百度团队以F值78.12%的成绩战胜了来自全球的210余支队伍,夺得冠军。

企业期待及时获取消费者的评价以改进服务、政府和媒体希望从海量文本中提取意见以成为决策参考与新闻素材……而互联网上还有大量评论数据沉淀,亟待深度应用。评论建议挖掘用于辅助决策,无疑是极具实用价值的自然语言处理任务!

赋予机器“认知”能力,是人工智能最具挑战的技术领域之一,自然语言处理属于认知部分的重要内容。更深入地理解语言,让机器具备人类的思考和理解能力意义重大。百度自然语言处理(NLP)领域已经过十余年积累与沉淀,具备了最前沿、最全面、最领先的技术布局,不仅专注于前瞻技术探索,更致力通过技术应用解决实际问题。目前,百度语义理解技术已广泛应用于百度内外,在搜索、信息流等一系列产品应用中发挥重要作用。

产业百度自然语言处理语义分析
1
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

百度智能云机构

百度是全球最大的中文搜索引擎,是一家互联网综合信息服务公司,更是全球领先的人工智能平台型公司。2000年1月1日创立于中关村,公司创始人李彦宏拥有“超链分析”技术专利,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

http://www.baidu.com
推荐文章
暂无评论
暂无评论~