Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

不会编程没关系,这些平台让你秒变语音程序开发师

想让Alexa讲你自己编的笑话?帮你复习考试?为你的保姆提供个性化的知道吗?

语音程序的巨大市场已经开放,在今年早些时候,仅亚马逊的Alexa平台就已经拥有超过80000项的技能。

据科技领域市场调研公司Canalys预测,全球智能音箱安装总数将从2018年的1.14亿部增长到2019年的2.079亿部,达到了一个相当可观的规模。

为了利用好这一趋势,有不少公司和开发者都在尝试创建简单易操作的平台,使普通团队能够使用最简便的方式为Alexa和Google助手开发新的语音应用程序。

其中有一家初创公司的首席执行官解释说,构建语音应用程序协作平台的想法来自于他之前作为语音应用程序开发人员的直接体验。

最初他的团队只是想开发一个语音应用程序,为Alexa提供交互式儿童故事,名为Storyflow。

但是当团队开始构建自己的冒险故事库的时候,他们突然意识到这个过程的扩展速度不够快,无法满足他们的用户群,因为他们根本无法通过正常的编程以足够快的速度构建所有分支的故事板。

“在当时,我们在一定程度上有了一个构思,就是做一个拖放功能,”Ream说“我希望我能够在一个步骤内就做到构建流程图、脚本和实际的代码,就这样我们在这个早期构架上对平台不断迭代,这其实是一种内部工具。”

他戏称自己和团队其它成员为书呆子,只用最常规的方式添加逻辑、变量和模块性,让这个平台变得更好。

最初他们让Storyflow的平台成为一个“声音版的YouTube”,这样任何人都可以轻松构建自己的故事。但是当Storyflow的社群了解了团队所构建的内容后,他们很快就想用它来构建自己的语音应用程序——而不仅仅是交互式故事。

Ream说:“那时我们突然灵光一现,这很容易成为构建语音应用程序的中心平台,不仅仅限于交互式儿童故事,而且改变起来非常容易,”他说“我们所要做的就是把我们的名字从StoryFlow改为VoiceFlow。”

该平台是为那些不知道如何编码的人设计的非技术性的软件。例如,它的两种基本块类型是“speak”和“choice”,当用户设计应用程序的流程时,可以在屏幕上通过拖放来进行组织。过程非常方便,只要你对自己的程序有所构思,很轻松就可以设计出想要的内容。

对于那些已经掌握一定技能的用户,还有高级模式可以添加逻辑和变量,但无论怎样,整个过程都是可视的。

对于企业客户,它们还有一个API模块,允许客户将企业自己的API集成到他们的语音应用程序中。

平台的基础功能都是免费的,从长远来看,该公司希望通过其平台帮助人们设计更好、更人性化的语音应用程序。为了维持运营和未来发展,他们开发了新的业务模式,允许企业内部合作构建语音应用程序。

那些包括语言学家、语音用户界面设计师和开发人员人员众多的语音机构,每月交付29美元,就能在统一的平台的付费工作区合作、共享项目和移交资产。

“现在的问题是现在主流的语音平台没有一致的行业标准,没有具体的实例基础,也没有很简单的方法将其付诸实践。如果我们能帮助培养10000名语音用户界面设计师,并为他们提供一个可访问的平台,在那里他们可以相互协作,我认为会看到对话质量的巨大提升。”

在这方面,它们已经启动了一个教辅项目,该项目包括线上视频教程,未来将会完善成为一个更加标准化的培训课程。

除了视频教程外,VoiceFlow在Facebook上有一个内部社群,包括2500多名开发人员、语言学家、教育工作者、设计师和企业家,他们经常积极讨论语音应用程序的设计和开发过程。平台与其用户群之间的这种交互是其关键卖点之一。

不过,盯着这一市场的可不止VoiceFlow,亚马逊官方不久前在Alexa Skills线上商店中也提供一款为Echo用户创建的语音应用——Skill Blueprints,其原理大同小异,不需要编码也可以制作自己的语音应用程序。

当前亚马逊已经预设了21个Alexa Blueprints模板,点击后可看到一个概览页面,听取技能样本、以及读取如何创建和使用app的指引。

编辑完成后,用户可以点击“体验”按钮,调整app开屏介绍、问候语、音效等设置。随后为应用取一个好名字,就可以通过“Alexa,打开***”之类的语音命令唤醒。

然而这个市场不止有蓬勃发展的企业,也有的走到了穷途末路。Invocable工具作为相似的VUI建构平台,将于2019年7月1日关闭,它们选择与VoiceFlow团队合作。

Invocable在其告别信中提出了自己不同的的看法,在2017年刚刚创建平台时他们认为:

1. 语音应用很简单,如果构建一个平台,让人们能够创建无编码的语音应用程序,大众就会喜欢使用它。

2. 非技术创意人员实际上能够创建出色的语音应用。

然而花了一年的时间他们才发现这些假设是错误的:

1. 首先语音应用并不简单,你需要成为一名出色的语音设计师才能构建引人入胜的语音应用。

2. 非技术创意人员虽然能够创建好的内容,但应用程序不仅仅是内容。技能本身就像一个巨大的产品,大多数内容创作者都不擅长产品管理。

他们还认为自然语言处理和理解还没有发展到可以支持更高质量的语音应用程序的程度,在消费者广泛采用语音交互方式之前,押注支持语音应用程序开发市场的合适平台还需要时间去证明。

参考链接:https://techcrunch.com/2019/04/23/voiceflow-which-allows-anyone-to-make-voice-apps-without-coding-raises-3-5-million/

声学在线
声学在线

产业亚马逊Alexa语音助手智能音箱自然语言处理
相关数据
Amazon机构

亚马逊(英语:Amazon.com Inc.,NASDAQ:AMZN)是一家总部位于美国西雅图的跨国电子商务企业,业务起始于线上书店,不久之后商品走向多元化。目前是全球最大的互联网线上零售商之一,也是美国《财富》杂志2016年评选的全球最大500家公司的排行榜中的第44名。

https://www.amazon.com/
相关技术
逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

语言学技术

每种人类语言都是知识和能力的复合体,语言的使用者能够相互交流,表达想法,假设,情感,欲望以及所有其他需要表达的事物。语言学是对这些知识体系各方面的研究:如何构建这样的知识体系,如何获取,如何在消息的制作和理解中使用它,它是如何随时间变化的?语言学家因此关注语言本质的一些特殊问题。比如: 所有人类语言都有哪些共同属性?语言如何不同,系统的差异程度如何,我们能否在差异中找到模式?孩子如何在短时间内获得如此完整的语言知识?语言随时间变化的方式有哪些,语言变化的局限性是什么?当我们产生和理解语言时,认知过程的本质是什么?语言学研究的就是这些最本质的问题。

推荐文章
暂无评论
暂无评论~