Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

声智科技SoundAI Azero智能操作系统:让机器更加智能的开发平台

9月20日,声智科技SoundAI Azero智能操作系统全新升级,标志着声智科技作为人工智能系统平台的旗舰型产品正式面世。

据悉,SoundAI Azero 是声智科技基于全球领先的远场语音交互技术为企业、个人及第三方开发者免费开放的全链条 AI 操作系统,致力于连接有价值的信息、服务与设备,让智能服务随处可享。SoundAI Azero 经过了数十亿次人机交互真实场景的规模验证,可为家居、办公、车载、可穿戴等 20+场景和设备提供高效的人机交互和智能决策能力。SoundAI Azero 默认集成了信息查询、影音娱乐、IoT 控制等 200+项常用技能与服务,同时提供简单好用的语音技能开发工具和一站式智能语音软硬件方案,可以极大降低 AI 行业应用的开发难度和使用门槛,快速满足不同用户和行业群体的个性化需求。

护城河初现,商业化空间不可限量

自 2016 年成立以来,声智科技便拥有声学矢量传感、声学阵列芯片、声学结构设计、远场声学处理(回声抵消、噪声抑制、声源定位、混响消除、波束形成等)、远场语音唤醒、远场声纹识别、远场语音识别、远场双工通话、自然语言理解、自然语音合成等自主核心技术,硬核实力获得行业广泛认可。基于声学与人工智能技术领域的优势,声智科技推出了 SoundAI Azero 智能操作系统,并应用在新产品的研发中。

作为 SoundAI Azero 智能操作系统在语音领域的垂直化解决方案,Azero 智能系统可以让设备获得智能语音交互的能力,并帮助实现「智能互联」,让设备真正成为您的「智能助手」,应声而动。

构建智能语音生态的软硬件一体化方案

SoundAI Azero 智能操作系统声智科技多年积累之后,顺应潮流之作。

据了解,SoundAI Azero 与 Alexa 类似,同样提供了从声学结构设计、远场语音交互、技能服务开发的一站式全链条解决方案,但其目的又不只是做好「中文版的 Alexa」,而是基于声智科技在中文语音市场丰富的服务经验,在各个细节做精、做细,帮助设备厂商又快又好地实现产品开发和量产。

SoundAI Azero 智能操作系统助力产品快速落地产品快速落地

语音交互方面,SoundAI Azero 智能操作系统集成了远场唤醒、波束形成、声源测向、噪声抑制、混响消除、回声消除、端点检测、语音识别、声纹识别、语义理解、语音合成、双工通话、自然语言处理、声波配网等多项技术,远场交互能力强,并支持硬件检测。

同时,SoundAI Azero 智能操作系统还支持自定义唤醒词。未来,设备商可以在 1~2 天内实现快速自定义唤醒词,以实现产品快速上市。而在产品上市之后,厂商还可以通过在线数据收集的方式来实现自定义唤醒词的迭代升级,让产品体验慢慢向「小爱同学」们靠近。

内容和服务方面,SoundAI Azero 智能操作系统接入了市面上主流的音乐、有声读物、视频平台,以及信息查询、生活服务、出行路况等服务,并通过免费技能的方式开放给合作伙伴,确保设备从一开始就具备了语音交互基础的内容和服务。同时,SoundAI Azero 智能操作系统还提供灵活的技能开发及接入方式,支持 Android、Linux、QNX 等七种系统以及多种播放器,常用技能开发部署时间一周以内,可极大缩短开发周期。

为了帮助合作伙伴完成快速开发,在云端,SoundAI Azero 智能操作系统还支持「内容+IoT+APP」三云合一;设备端,SoundAI Azero 智能操作系统对 Turnkey 代码进行了开源。基于此,设备上最快可以实现 7 天完成快速开发工作。 

在应用场景方面,SoundAI Azero 智能操作系统除了我们熟悉的智能音箱外,也将支持智能家居、智能会议、智能教育、智能医疗、智能汽车、金融科技、能源电力、智能法院、智能交通和机器人等多种应用场景下多个终端产品。

「SoundAI Azero 智能操作系统不止是针对智能音箱,声智科技希望将语音引申到各行各业,用一套系统解决所有事情,降低中小客户在这方面的投入。」

目前,声智科技深耕智能家居、智能会议、智能教育、智能医疗、智能制造、智能汽车、金融科技、能源电力、智慧法院、智能交通和机器人等行业,与 ARM、Cadence、NVIDIA、Xilinx、Bosch、Infineon、Risc-V、百度腾讯华为等著名公司和组织深度合作,服务360b3dc7fd0>小米、百度、阿里、华为腾讯、中国移动、中国电信、奇虎 360、中央人民广播电台、联想、创维、金蝶、浪潮、国美等众多客户。

关于声智

声智科技是融合声学和人工智能技术的平台服务商,致力于实现「让机器更智能」的使命,达成「用科技改善生活」的愿景,主要提供 SoundAI Azero 智能操作系统和服务,以及深度结合应用场景的人工智能技术和产品解决方案,典型应用于智能家居、智能会议、智能教育、智能医疗、智能制造、智能汽车、金融科技、能源电力、智慧法院、智能交通和机器人等领域,拥有声学矢量传感、声学阵列芯片、声学结构设计、远场声学处理(回声抵消、噪声抑制、声源定位、混响消除、波束形成等)、远场语音唤醒、远场声纹识别、远场语音识别、远场双工通话、自然语言理解、自然语音合成、超远场声学监控、超近场语音交互、分布场语音交互、深度学习与小样本学习、智能搜索与个性化推荐、知识图谱与智能分析、精准用户时空画像等自主核心技术。

产业声智科技语音交互
11
相关数据
声智科技机构

声智科技是融合声学和人工智能技术的平台服务商,致力于实现“让机器更智能”的使命,达成“用科技改善生活”的愿景,主要提供SoundAI Azero智能操作系统和服务,以及深度结合应用场景的人工智能技术和产品解决方案,典型应用于智能家居、智能会议、智能教育、智能医疗、智能制造、智能汽车、金融科技、能源电力、智慧法院、智能交通和机器人等领域,是全球最大的智能语音技术和平台服务商之一。

http://www.soundai.com
华为机构

华为创立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。

https://www.huawei.com/cn/
自然语言理解技术

自然语言理解是人工智能的核心课题之一,也被广泛认为是最困难和最具标志性的任务。最经典的两个人工智能思想实验——图灵测试和中文房间,都是围绕自然语言理解来构建的。自然语言理解在人工智能技术体系中的重要性不言而喻,它一方面承载着机器和人的交流,另一方面直达知识和逻辑。自然语言理解也是人工智能学者孜孜以求的圣杯,机器学习的巨擘 Michael I. Jordan 就曾经在 Reddit 上的 AMA(Ask Me Anything)栏目中畅想用十亿美元建立一个专门用于自然语言理解的实验室。

语音合成技术

语音合成,又称文语转换(Text to Speech)技术,是将人类语音用人工的方式所产生,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

操作系统技术

操作系统(英语:operating system,缩写作 OS)是管理计算机硬件与软件资源的计算机程序,同时也是计算机系统的内核与基石。操作系统需要处理如管理与配置内存、决定系统资源供需的优先次序、控制输入与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互的操作界面。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

百度智能云机构

百度是全球最大的中文搜索引擎,是一家互联网综合信息服务公司,更是全球领先的人工智能平台型公司。2000年1月1日创立于中关村,公司创始人李彦宏拥有“超链分析”技术专利,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

http://www.baidu.com
联想集团机构

联想集团是1984年中国科学院计算技术研究所投资20万元人民币,由11名科技人员创办,是中国的一家在信息产业内多元化发展的大型企业集团,和富有创新性的国际化的科技公司。 从1996年开始,联想电脑销量一直位居中国国内市场首位;2005年,联想集团收购IBM PC(Personal computer,个人电脑)事业部;2013年,联想电脑销售量升居世界第一,成为全球最大的PC生产厂商。2014年10月,联想集团宣布了该公司已经完成对摩托罗拉移动的收购。 作为全球电脑市场的领导企业,联想从事开发、制造并销售可靠的、安全易用的技术产品及优质专业的服务,帮助全球客户和合作伙伴取得成功。联想公司主要生产台式电脑、服务器、笔记本电脑、智能电视、打印机、掌上电脑、主板、手机、一体机电脑等商品。 自2014年4月1日起, 联想集团成立了四个新的、相对独立的业务集团,分别是PC业务集团、移动业务集团、企业级业务集团、云服务业务集团。2016年8月,全国工商联发布“2016中国民营企业500强”榜单,联想名列第四。 2018年12月,世界品牌实验室编制的《2018世界品牌500强》揭晓,排名第102。

腾讯机构

腾讯,1998年11月诞生于中国深圳,是一家以互联网为基础的科技与文化公司。我们的使命是“通过互联网服务提升人类生活品质”。腾讯秉承着 “一切以用户价值为依归”的经营理念,为亿万网民提供优质的互联网综合服务。 腾讯的战略目标是“连接一切”,我们长期致力于社交平台与数字内容两大核心业务:一方面通过微信与QQ等社交平台,实现人与人、服务及设备的智慧连接;另一方面为数以亿计的用户提供优质的新闻、视频、游戏、音乐、文学、动漫、影业等数字内容产品及相关服务。我们还积极推动金融科技的发展,通过普及移动支付等技术能力,为智慧交通、智慧零售、智慧城市等领域提供有力支持。

http://www.tencent.com/
相关技术
奇虎360机构

360公司成立于2005年8月,创始人周鸿祎 2011年3月30日在纽交所成功上市 2018年2月28日,回归A股上市,上证交易所(601360) 是中国第一大互联网安全公司,用户6.5亿,市场渗透率94.7% 中国第一大移动互联网安全公司,用户数超过8.5亿 中国领先的AIoT公司,将人工智能技术应用于智能生活、家庭安防、出行安全、儿童安全等多个领域

http://smart.360.cn/cleanrobot/
小米集团机构

小米公司正式成立于2010年4月,是一家专注于智能手机自主研发的移动互联网公司,定位于高性能发烧手机。小米手机、MIUI、米聊是小米公司旗下三大核心业务。“为发烧而生”是小米的产品理念。小米公司首创了用互联网模式开发手机操作系统、发烧友参与开发改进的模式。2018年7月,工业和信息化部向与中国联合网络通信集团有限公司首批签约的15家企业发放了经营许可证,批准其经营移动通信转售业务,其中包括:小米科技有限责任公司。 2018年7月9日,正式登陆香港交易所主板 。

https://www.mi.com/
小样本学习技术

人类非常擅长通过极少量的样本识别一个新物体,比如小孩子只需要书中的一些图片就可以认识什么是“斑马”,什么是“犀牛”。在人类的快速学习能力的启发下,研究人员希望机器学习模型在学习了一定类别的大量数据后,对于新的类别,只需要少量的样本就能快速学习,这就是 Few-shot Learning 要解决的问题。

推荐文章
新一代OS?