Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

联合瑞芯微电子,猎户星空发布全链条AI 语音芯片

随着人工智能技术的场景化落地,人工智能芯片的应用领域也不断向多维方向发展。在消费电子、安防监控、自动驾驶汽车以及云计算等各类场景,对AI芯片的不同定位,促使众多公司开始探索适用于专用场合的芯片解决方案。

近日,猎豹移动旗下的人工智能公司猎户星空联合瑞芯微电子宣布发布了专门针对智能语音和物联网设备的 AI 芯片—— OS1000RK。猎户星空表示,这是全球首款全链条 AI 语音芯片,目前,该芯片已经成功落地到数十万台智能音箱——小雅Nano 中,并预计将在今年年底达到百万的出货量。

微信图片_20190114110139图为猎户星空发布的全链条AI语音芯片OS1000RK

联合瑞芯微电子,猎户星空发布首款全链条 AI 语音芯片

与行业内集成多个算法方案的芯片不同,猎户星空此次联合瑞芯微电子所发布的,是行业内首款全链条 AI 语音芯片。OS1000RK采用低功耗高性能的 CPU 核—— 64 位 4 核ARMCortex-A35 ,整合了高性能的 CODEC(8通道ADC+2通道DAC),可以非常低成本地支持多达 8 个麦克风阵列,其硬件语音检测模块(VAD)可以实现很低的待机功能,专用指令集则可以让神经网络的运行更加优化。

由于集合了猎户星空自主研发的全链条语音技术,和瑞芯微电子多年来成熟的芯片工艺。OS1000RK既做到了功耗低、通用性强,又能够实现从语音唤醒、语音理解、语音合成等全链条的语音交互能力。一键式解决智能硬件产品语音AI化的需求,且在价格和性能上具有非常强的竞争力。

一般智能设备如果进行智能化升级,需要从硬件、芯片、AI 算法、软件等多方面对接多套能力系统,调试每一个接口融合,最后的效果也不一定具备竞争力,创业公司为此耗费了大量人力、物力和财力成本。猎户星空此次发布的芯片OS1000RK提供了包括算法和系统在内的一站式解决方案,破除了行业难题。

智能音箱市场在经历了 2017 年的小爆发后,在2018 年迎来持续性的增长。市场研究机构 eMarketer 预计, 2019 年,增长还会继续,届时中国将有 8550 万智能音箱用户。

智能音箱的井喷使得全新的交互方式——语音交互变得普及。智能音箱之外,家庭和办公场景中的更多硬件设备开始语音化、智能化,原有的通用芯片已经不能满足行业需求。针对特定场景的 AI 语音芯片应运而生。

高通、英伟达、英特尔等还没有进入的语音芯片市场,已经有创业公司开始布局 AI 语音芯片。从2018年上半年开始,国内数家语音技术创业公司陆续推出了各家的AI语音专用芯片。不过,有分析指出,AI专用语音芯片能否持续爆发,一方面要看这些芯片能否大规模应用于产品,另一方面还要看这些产品的语音交互能力到底能否得到用户的青睐和市场的检验。

猎户星空此次发布的芯片OS1000RK已经正式量产,广泛应用于数十万台智能设备当中。前不久首批 10 万台售罄的“爆款”智能音箱小雅Nano 就采用了这款新发布的 AI 语音芯片,实现了流畅的语音交互能力。未来它还将广泛应用于智能家居、故事机等在内的更多智能设备中。

猎户将推出更多 AI 领域专用芯片

猎户星空成立于 2016 年,是猎豹移动投资的人工智能公司。创始之初就汇聚了来自美国硅谷、日本、北京、深圳、台湾等全球一流科技公司的 AI 精英人才。

目前,猎户星空已经搭建了由数十名芯片行业资深专家组成的AI芯片开发团队。团队成员来自英特尔(Intel),英伟达(Nvidia)、华为、Marvell、展讯、Skyworks、Broadcom等知名半导体公司。

两年多的时间里,猎户星空搭建了全自研的猎户机器人平台Orion OS,它集合芯片+算法(脑),全感知视觉识别(眼),麦克风阵列(耳),语音合成技术(口),室内导航平台(腿)和七轴机械臂(手),是目前行业唯一的全链条技术平台。

如今,全自研的猎户语音 OS 技术已经应用到了小米小爱同学、美的小美AI音箱、喜马拉雅小雅音箱、猎豹移动小豹AI音箱等多家合作伙伴的产品中。据统计,猎户语音OS每天线上语音指令超过2000万次,拥有上百万小时的远场语音数据积累。作为应用最广的语音合成技术,猎户语音OS占有中国智能语音市场份额超过30%。 

此次强强联合发布的 AI 语音芯片,是猎户语音 OS 全链条技术的软硬一体化落地。

猎户星空首席战略官王兵表示,如今芯片行业的核心能力已经不再单纯是硬件的竞争,而是包括硬件在内的全栈技术能力的竞争。猎户星空所积累的全链条AI 技术、海量数据、对应用场景的理解和机器人产品的量产能力,将助力其打造行业内最具竞争力的 AI 芯片。

插图3图为机器人家族

猎户星空最后还表示将结合专业化的场景,发布视觉、导航等更多领域的专用芯片。与合作伙伴一起,共同推动 AI 芯片行业的进步。

产业猎户星空语音交互芯片产品
1
相关数据
英特尔机构

英特尔(NASDAQ: INTC)是全球半导体行业的引领者,以计算和通信技术奠定全球创新基石,塑造以数据为中心的未来。我们通过精尖制造的专长,帮助保护、驱动和连接数十亿设备以及智能互联世界的基础设施 —— 从云、网络到边缘设备以及它们之间的一切,并帮助解决世界上最艰巨的问题和挑战。

http://www.intel.cn/
相关技术
Qualcomm机构

高通公司(英语:Qualcomm,NASDAQ:QCOM)是一个位于美国加州圣地亚哥的无线电通信技术研发公司,由加州大学圣地亚哥分校教授厄文·马克·雅克布和安德鲁·维特比创建,于1985年成立。两人此前曾共同创建Linkabit。 高通公司是全球3G、4G与5G技术研发的领先企业,目前已经向全球多家制造商提供技术使用授权,涉及了世界上所有电信设备和消费电子设备的品牌。根据iSuppli的统计数据,高通在2007年度一季度首次一举成为全球最大的无线半导体供应商,并在此后继续保持这一领导地位。其骁龙移动智能处理器是业界领先的全合一、全系列移动处理器,具有高性能、低功耗、逼真的多媒体和全面的连接性。目前公司的产品和业务正在变革医疗、汽车、物联网、智能家居、智慧城市等多个领域。

http://www.qualcomm.com/
华为机构

华为创立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。

https://www.huawei.com/cn/
自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

自动驾驶汽车技术

自动驾驶汽车,又称为无人驾驶汽车、电脑驾驶汽车或轮式移动机器人,是自动化载具的一种,具有传统汽车的运输能力。作为自动化载具,自动驾驶汽车不需要人为操作即能感测其环境及导航。

语音合成技术

语音合成,又称文语转换(Text to Speech)技术,是将人类语音用人工的方式所产生,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

云计算技术

云计算(英语:cloud computing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备。

麦克风阵列技术

麦克风阵列(Microphone Array),从字面上,指的是麦克风的排列。也就是说由一定数目的声学传感器(一般是麦克风)组成,用来对声场的空间特性进行采样并处理的系统。 早在20世纪70、80年代,麦克风阵列已经被应用于语音信号处理的研究中,进入90年代以来,基于麦克风阵列的语音信号处理算法逐渐成为一个新的研究热点。而到了“声控时代”,这项技术的重要性显得尤为突出。

OneFlow机构

一流科技是一家集生产、 研发和销售为一体的创新型人工智能领域创业公司。主营产品是具有完全自主知识产权的分布式深度学习框架OneFlow,同时也提供集算力算法、数据管理于一体的一站式的机器学习平台。OneFlow支持进行大规模分布式训练,支持市场主流硬件芯片和算法。作为企业级人工智能深度学习引擎,OneFlow支持私有云部署和公有云部署,可通过软件平台提供线上自动化的模型训练服务,也可提供定制化的一站式人工智能解决方案。公司创始人为袁进辉,清华大学博士、博士后,师从中国人工智能泰斗张钹院士,研究方向为计算机视觉及机器学习

https://www.oneflow.org
相关技术
小米集团机构

小米公司正式成立于2010年4月,是一家专注于智能手机自主研发的移动互联网公司,定位于高性能发烧手机。小米手机、MIUI、米聊是小米公司旗下三大核心业务。“为发烧而生”是小米的产品理念。小米公司首创了用互联网模式开发手机操作系统、发烧友参与开发改进的模式。2018年7月,工业和信息化部向与中国联合网络通信集团有限公司首批签约的15家企业发放了经营许可证,批准其经营移动通信转售业务,其中包括:小米科技有限责任公司。 2018年7月9日,正式登陆香港交易所主板 。

https://www.mi.com/
推荐文章
暂无评论
暂无评论~