体验谷歌云平台的三大机器学习API:视觉、语音和自然语言

最近谷歌在其云机器学习 API 的产品页面上添加了 Try the API box:云视觉 API(Cloud Vision API)语音 API(Speech API)和自然语言 API(Natural Language API)。现在任何人都可以立即用自己的图像、声音和文本上体验谷歌的机器智能了。让我们来看看它是怎么玩的。

machine-intelligence-5.png


尝试云视觉 API


云视觉 API 使得开发者能通过将强大的机器学习模型封装进一个容易使用的 REST API 中来理解一张图片的内容。现在来试一试,进入云视觉产品页面,并在 Try the API box 中的下拉或打开任意一张图片。点击「验证码」对话框来证明你不是一个自动化的脚本,然后图像打开。

下面这张图显示了这个视觉 API 对一张照片的描述。照片上的南瓜灯是我和儿子在万圣节聚会上雕刻的。

machine-intelligence-11.png

使用这个 API 的标签识别法,Cloud Vision 能对上传的图像进行图像内容分析。看上去,Cloud Vision 的机器智能非常聪明,不仅能理解这个对象,还能理解语境(「万圣节」、「假期」,「雕刻」)。很棒吧?你也可以点击 JSON 响应选项卡来查看看这张图片分析的原生 JSON 格式。


光学字符识别(OCR)


这个 API 的另一个令人印象深刻的功能时光学字符识别(Optical Character Recognition,OCR)。它能识别出图像中多种语言的字符和单词,并将它们提取成字符串,附加上每个单词在图像中的位置。让我们用下面这张图来试试这个功能。

machine-intelligene-14.png

当你在 box 中打开这张图片,并打开文本选项卡时,你就能看到 OCR 的分析结果了。

machine-intelligence-14.png

即便这张图中的单词的角度有点斜,还不太清楚,但 OCR 准确的提取词和他们的位置。它甚至能从参会者的 T 恤上选出「beacon」一词。


清楚图片、地标、Logo 的检测


云视觉 API 也能检测其他特征,包括常见的地标和公司或产品 logo,都有着极高的准确率。同时,安全搜索检测,成人、暴力内容的检测,医学或假冒图像检测,都已经被用于数个社交内容提供商的产品中。先前,这些社交提供商雇佣大量的职员单个审核、过滤用户上传的有问题的图像。在安全搜索上,这能减少大量的人力。

machine-intelligence-15.png

尝试云语音 API


你是否注意到年轻人使用语音控制智能手机?现代智能手机中支持谷歌搜索和谷歌 Now 的语音识别引擎的背后云语音 API。现在,你可以在自己的应用上使用这一突破性的技术了。例如,一家呼叫中心提供商可以使用云语音 API 将音频数据转换为文本,然后你就可以使用自然语言 API 分析这些文本,我们接下来会对此进行讨论。


云语音 API 也有一个 Try the API box。进入谷歌产品页面,点击麦克风图标,记录一个超过 30 秒的音频。完成记录后,它将音频上传到 API 并展示结果。


machine-intelligence-4.png


你也可以在云语音 API 上尝试除英语外的语言。从列表中选择它所支持的 80 种语言与方言。个人发现,云语音 API 在日语上的表现也相当惊人。


machine-intelligence-2.png

尝试自然语言 API


很多开发者使用简单的关键词或常见表达匹配来处理自然语言文本。换言之,他们将文本作为无结构数据处理,没有关于文本含义的任何线索。


使用云自然语言 API,强大的机器学习模型揭示数据中的结构和含义,里面有一个易于使用的 REST API。现在你掌握的文本是结构化数据的,有各种特性和元数据。通过处理、分析或查询来自终端客户的文本,你可以增加自己应用的智能度了。


下面就是自然语言 API 的 Try the API box 了。直接点击分析按钮就能探索文本样本了。


machine-intelligence-6.png

Entities 标签中显示的是实体分析结果。给定缺省样本文本,文本中的 Google 一词被分类为公司名,Mountain View 是个地址。据自然语言 API 显示,Sundar Pichai 是一个名人,Android 是个消费品。在可用的情况下,云自然语言 API 也将回复这些实体的 Wikipedia 链接页面。


情感和语法分析


对文本情感的分析,点击 Sentiment 标签就能完成。


machine-intelligence-10.png

据云自然语言 API 显示,"Sundar Pichai said in his keynote that users love their new Android phones"一句有着积极的情感。点击 Syntax 标签,你也可以进行语句的语法分析。

machine-intelligence-7.png


JSON 语义分析方法的响应提供了建立该文本的依存句法分析树(dependence parse tree)数据,如上图所示。有了这个功能后,你可以把整句话拆分成几个标记,和每个标记的词性(POS)如名词和动词,以及它们之间的依存关系。现在非结构化数据变成了带有分析(insight)的结构化数据。



使用云机器学习 API 开发惊人的 App


如同该文章显示的那样,使用里面的 Try the API boxes,你可以轻松体验谷歌最新的机器学习技术。

云视觉 API 如今普遍可用,语音 API 和自然语言 API 处于测试阶段,任何人都可以对其进行评估。

入门谷歌云计算API工程机器学习