Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

阿里国际化展现翻译AI价值,达摩院获WMT机器翻译大赛5项冠军

在刚刚结束的 WMT2018 国际机器翻译大赛上,阿里巴巴达摩院机器智能-NLP 翻译团队打败多个国外巨头与研究机构,在所有提交的 5 项比赛中,全数获得冠军。这 5 个项目包括英文-中文翻译、英文-俄罗斯语互译、英文-土耳其语互译,达摩院在这几个项目的自动评测指标 BLEU 都位居第一。

达摩院获得 5 个项目自动评测第一名

WMT 全称 Workshop on Machine Translation,是国际公认的顶级机器翻译赛事之一,也是各大科技公司与学术机构展示自身机器翻译实力的平台。2018 年更吸引了包括翰霍普金斯大学、爱丁堡大学、亚琛工业大学、马里兰大学、微软、腾讯等在内的几十个团队参与。

由达摩院机器智能技术实验室资深算法专家陈博兴博士带领的达摩院机器翻译团队,在此次比赛中,基于业界最新的 Transformer 结构,进行了网络结构的改进和对词语位置信息的充分利用,全面改进了机器翻译的性能。同时充分利用阿里的计算资源优势,训练数据和模型的规模都达到了行业最高纪录。陈博兴博士是国际权威的机器翻译专家,曾任加拿大国家研究委员会研究员,担任过 NLP 领域所有顶级会议和期刊的审稿人,并曾多次在各类机器翻译评测中取得优异成绩。

 达摩院机器智能实验室资深算法专家陈博兴博士

此次达摩院不仅在竞争最激烈的英中翻译上继续保持优势,值得一提的是,阿里还将机器翻译的技术优势延伸至俄语、土耳其语等多个语种。以往这些语言的机器翻译技术,都由谷歌等国外公司与研究机构保持领先。

据透露,阿里巴巴的电商机器翻译总量已经达到每日 7.5 亿次。对于阿里的国际化发展而言,「语言」是一大门槛。以阿里巴巴国际站为例,七成买家以英语沟通,还有 30% 为小语种。而卖家端的调研数据显示,大约 96% 的卖家对小语种无能为力。这一现状,也催生了对机器翻译的巨大需求。

阿里达摩院机器智能实验室 NLP 首席科学家司罗表示:「机器翻译的发展无法脱离用户与场景,阿里机器翻译的不断进步,得益于在电商、新零售、物流等领域积累的丰富场景和数据。特别是在俄语、土耳其语、西班牙语的探索上,让我们看到了机器翻译的巨大商业价值与应用潜力。」

阿里的机器翻译技术除了应用于电商全链路服务之外,还广泛应用于菜鸟物流通关、阿里云国际社区、飞猪旅行翻译助手、钉钉社交口语翻译等一系列产品。

工程阿里巴巴达摩院机器翻译NLPWMT
相关数据
机器翻译技术

机器翻译(MT)是利用机器的力量「自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)」。机器翻译方法通常可分成三大类:基于规则的机器翻译(RBMT)、统计机器翻译(SMT)和神经机器翻译(NMT)。

推荐文章
暂无评论
暂无评论~