Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

谷歌拍照翻译功能新增13种支持语言 总支持语言达到50种

iOS和Android端Translate APP中的相机翻译功能新增支持13种语言,包括阿拉伯语,孟加拉语,印地语,泰语和越南语等。

近期,Google Translate 新增支持的语言数量,兼容Camera Translation功能。新增支持的13种新语言包括阿拉伯语,泰语,越南语,印地语,孟加拉语,古吉拉特语,卡纳达语,马拉雅拉姆语,马拉地语,尼泊尔语,旁遮普语,泰米尔语,泰卢固语,同时该功能也即将同时支持 Android 系统和 iOS 系统,相信 Google Translate 可以帮助你更加便捷地探索周围的世界。

公司发言人在回复外媒VentureBeat的信件中表示,本次更新已经于今天开始推送,并会在接下来几天面向全球Translate APP用户开放。

有了 Camera Translation 这一功能,你可以翻译你所拍到的东西。在 Google Translate 应用程序中,你只需要选择当前需要被翻译的语言和目标语言,如:需要将印地语翻译成英语,然后点击相机图标,对含有外语的标志、菜单或者文本等进行拍照。

拍照完成后,用手指滑动需要翻译的文本,即可看到翻译后的文本以蓝色字体的形式呈现在页面最顶端。你也可以对以前拍摄过的照片内容进行翻译,只需点击相机图标,然后在屏幕的左下方上传图片即可。

Camera Translation 这一功能由机器学习技术驱动。事实上,该功能有两个步骤涉及到人工智能的应用。首先,应用程序使用光学字符识别技术对图像上的字母和字符进行识别,光学字符识别技术是一种将图像上的字母转换为数据的机器学习系统。接下来,一旦文本被识别,神经机器翻译系统就会将该文本翻译成所需语言的自然发音的句子或短语。

2015年谷歌首次在Translate APP中引入了相机翻译功能,首批支持27种语言,用户使用手机相机拍摄广告牌或者菜单,该功能可以实时将其转换为使用者的母语。在本次更新后,Google Translate 的 Camera Translation 功能已支持 50 种语言,包括泰语,越南语,尼泊尔语,印地语,孟加拉语,古吉拉特语等。

产业google translateCamera Translation
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

神经机器翻译技术

2013 年,Nal Kalchbrenner 和 Phil Blunsom 提出了一种用于机器翻译的新型端到端编码器-解码器结构 [4]。该模型可以使用卷积神经网络(CNN)将给定的一段源文本编码成一个连续的向量,然后再使用循环神经网络(RNN)作为解码器将该状态向量转换成目标语言。他们的研究成果可以说是神经机器翻译(NMT)的诞生;神经机器翻译是一种使用深度学习神经网络获取自然语言之间的映射关系的方法。NMT 的非线性映射不同于线性的 SMT 模型,而且是使用了连接编码器和解码器的状态向量来描述语义的等价关系。此外,RNN 应该还能得到无限长句子背后的信息,从而解决所谓的「长距离重新排序(long distance reordering)」问题。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

光学字符识别技术

光学字符识别是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。在这个过程中,手写的、打印的等多种类型的图像被转换为机器编码的文本,这些含有文字信息的图像可以是扫描而来,也可以是场景文本——如照片中出现的广告牌文字 (scene text),或者叠加在图像上的文字 (overlay text)——如电视节目中常见的字幕等等。光学字符识别是一种将印刷文本数字化的常用方法,可以对其进行电子编辑、搜索、更紧凑地存储、在线显示,并用于认知计算、机器翻译、(提取)文本到语音、 关键数据和文本挖掘。 OCR是模式识别人工智能和计算机视觉领域的一个重要的研究领域。

推荐文章
暂无评论
暂无评论~