联合瑞芯微电子,猎户星空发布全链条AI 语音芯片

随着人工智能技术的场景化落地,人工智能芯片的应用领域也不断向多维方向发展。在消费电子、安防监控、自动驾驶汽车以及云计算等各类场景,对AI芯片的不同定位,促使众多公司开始探索适用于专用场合的芯片解决方案。

近日,猎豹移动旗下的人工智能公司猎户星空联合瑞芯微电子宣布发布了专门针对智能语音和物联网设备的 AI 芯片—— OS1000RK。猎户星空表示,这是全球首款全链条 AI 语音芯片,目前,该芯片已经成功落地到数十万台智能音箱——小雅Nano 中,并预计将在今年年底达到百万的出货量。

微信图片_20190114110139图为猎户星空发布的全链条AI语音芯片OS1000RK

联合瑞芯微电子,猎户星空发布首款全链条 AI 语音芯片

与行业内集成多个算法方案的芯片不同,猎户星空此次联合瑞芯微电子所发布的,是行业内首款全链条 AI 语音芯片。OS1000RK采用低功耗高性能的 CPU 核—— 64 位 4 核ARMCortex-A35 ,整合了高性能的 CODEC(8通道ADC+2通道DAC),可以非常低成本地支持多达 8 个麦克风阵列,其硬件语音检测模块(VAD)可以实现很低的待机功能,专用指令集则可以让神经网络的运行更加优化。

由于集合了猎户星空自主研发的全链条语音技术,和瑞芯微电子多年来成熟的芯片工艺。OS1000RK既做到了功耗低、通用性强,又能够实现从语音唤醒、语音理解、语音合成等全链条的语音交互能力。一键式解决智能硬件产品语音AI化的需求,且在价格和性能上具有非常强的竞争力。

一般智能设备如果进行智能化升级,需要从硬件、芯片、AI 算法、软件等多方面对接多套能力系统,调试每一个接口融合,最后的效果也不一定具备竞争力,创业公司为此耗费了大量人力、物力和财力成本。猎户星空此次发布的芯片OS1000RK提供了包括算法和系统在内的一站式解决方案,破除了行业难题。

智能音箱市场在经历了 2017 年的小爆发后,在2018 年迎来持续性的增长。市场研究机构 eMarketer 预计, 2019 年,增长还会继续,届时中国将有 8550 万智能音箱用户。

智能音箱的井喷使得全新的交互方式——语音交互变得普及。智能音箱之外,家庭和办公场景中的更多硬件设备开始语音化、智能化,原有的通用芯片已经不能满足行业需求。针对特定场景的 AI 语音芯片应运而生。

高通、英伟达、英特尔等还没有进入的语音芯片市场,已经有创业公司开始布局 AI 语音芯片。从2018年上半年开始,国内数家语音技术创业公司陆续推出了各家的AI语音专用芯片。不过,有分析指出,AI专用语音芯片能否持续爆发,一方面要看这些芯片能否大规模应用于产品,另一方面还要看这些产品的语音交互能力到底能否得到用户的青睐和市场的检验。

猎户星空此次发布的芯片OS1000RK已经正式量产,广泛应用于数十万台智能设备当中。前不久首批 10 万台售罄的“爆款”智能音箱小雅Nano 就采用了这款新发布的 AI 语音芯片,实现了流畅的语音交互能力。未来它还将广泛应用于智能家居、故事机等在内的更多智能设备中。

猎户将推出更多 AI 领域专用芯片

猎户星空成立于 2016 年,是猎豹移动投资的人工智能公司。创始之初就汇聚了来自美国硅谷、日本、北京、深圳、台湾等全球一流科技公司的 AI 精英人才。

目前,猎户星空已经搭建了由数十名芯片行业资深专家组成的AI芯片开发团队。团队成员来自英特尔(Intel),英伟达(Nvidia)、华为、Marvell、展讯、Skyworks、Broadcom等知名半导体公司。

两年多的时间里,猎户星空搭建了全自研的猎户机器人平台Orion OS,它集合芯片+算法(脑),全感知视觉识别(眼),麦克风阵列(耳),语音合成技术(口),室内导航平台(腿)和七轴机械臂(手),是目前行业唯一的全链条技术平台。

如今,全自研的猎户语音 OS 技术已经应用到了小米小爱同学、美的小美AI音箱、喜马拉雅小雅音箱、猎豹移动小豹AI音箱等多家合作伙伴的产品中。据统计,猎户语音OS每天线上语音指令超过2000万次,拥有上百万小时的远场语音数据积累。作为应用最广的语音合成技术,猎户语音OS占有中国智能语音市场份额超过30%。 

此次强强联合发布的 AI 语音芯片,是猎户语音 OS 全链条技术的软硬一体化落地。

猎户星空首席战略官王兵表示,如今芯片行业的核心能力已经不再单纯是硬件的竞争,而是包括硬件在内的全栈技术能力的竞争。猎户星空所积累的全链条AI 技术、海量数据、对应用场景的理解和机器人产品的量产能力,将助力其打造行业内最具竞争力的 AI 芯片。

插图3图为机器人家族

猎户星空最后还表示将结合专业化的场景,发布视觉、导航等更多领域的专用芯片。与合作伙伴一起,共同推动 AI 芯片行业的进步。

产业产品芯片语音交互猎户星空
1
相关数据
英特尔机构

英特尔是计算创新领域的全球领先厂商,致力于拓展科技疆界,让最精彩体验成为可能。英特尔创始于1968年,已拥有近半个世纪产品创新和引领市场的经验。英特尔1971年推出了世界上第一个微处理器,后来又促进了计算机和互联网的革命,改变了整个世界的进程。如今,英特尔正转型成为一家数据公司,制定了清晰的数据战略,凭借云和数据中心、物联网、存储、FPGA以及5G构成的增长良性循环,提供独到价值,驱动日益发展的智能互联世界。英特尔专注于技术创新,同时也积极支持中国的自主创新,与产业伙伴携手推动智能互联的发展。基于明确的数据战略和智能互联全栈实力,英特尔瞄准人工智能、无人驾驶、5G、精准医疗、体育等关键领域,与中国深度合作。面向未来,英特尔致力于做中国高价值合作伙伴,在新科技、新经济、新消费三个方面,着力驱动产业协同创新,为实体经济增值,促进消费升级。

https://www.intel.com/content/www/us/en/company-overview/company-overview.html
相关技术
高通机构

高通公司(英语:Qualcomm,NASDAQ:QCOM)是一个位于美国加州圣地亚哥的无线电通信技术研发公司,由加州大学圣地亚哥分校教授厄文·马克·雅克布和安德鲁·维特比创建,于1985年成立。两人此前曾共同创建Linkabit。 高通公司是全球3G、4G与5G技术研发的领先企业,目前已经向全球多家制造商提供技术使用授权,涉及了世界上所有电信设备和消费电子设备的品牌。根据iSuppli的统计数据,高通在2007年度一季度首次一举成为全球最大的无线半导体供应商,并在此后继续保持这一领导地位。其骁龙移动智能处理器是业界领先的全合一、全系列移动处理器,具有高性能、低功耗、逼真的多媒体和全面的连接性。目前公司的产品和业务正在变革医疗、汽车、物联网、智能家居、智慧城市等多个领域。

华为机构

华为成立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。华为的主要业务分布在无线、网络、软件、服务器、云计算、人工智能与大数据、安全、智能终端等领域,发布了5G端到端解决方案、智简网络、软件平台、面向行业的云解决方案、EI企业智能平台、新一代FusionServer V5服务器、HUAWEI Mate等系列智能手机、麒麟系列AI芯片等产品。目前华为拥有18万员工,36所联合创新中心,14所研究院/所/室,业务遍及170多个国家和地区。

http://www.huawei.com/cn
自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

自动驾驶汽车技术

自动驾驶汽车,又称为无人驾驶汽车、电脑驾驶汽车或轮式移动机器人,是自动化载具的一种,具有传统汽车的运输能力。作为自动化载具,自动驾驶汽车不需要人为操作即能感测其环境及导航。

语音合成技术

语音合成,又称文语转换(Text to Speech)技术,是将人类语音用人工的方式所产生,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

云计算技术

云计算(英语:cloud computing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备。

麦克风阵列技术

麦克风阵列(Microphone Array),从字面上,指的是麦克风的排列。也就是说由一定数目的声学传感器(一般是麦克风)组成,用来对声场的空间特性进行采样并处理的系统。 早在20世纪70、80年代,麦克风阵列已经被应用于语音信号处理的研究中,进入90年代以来,基于麦克风阵列的语音信号处理算法逐渐成为一个新的研究热点。而到了“声控时代”,这项技术的重要性显得尤为突出。

一流科技机构

一流科技是一家面向于人工智能领域的创新型高科技公司,主要产品为OneFlow最快深度学习引擎,第一个也是唯一一个可以应对大规模数据深度学习训练的流式系统,旨在帮助用户解决人工智能中大数据大模型大计算等问题。一方面,oneflow降低了用户工程师在编写深度学习方面分布式训练程序的门槛;另一方面,系统支持了不同的深度学习网络模型,并实现线性加速, 极大的提高了用户GPU服务器的硬件利用率,打破其他框架中只靠硬件却无法解决的大规模数据计算问题。

http://www.oneflow.org/
相关技术
小米机构

小米是中国一家专注于智能硬件、智能家居以及软件开发的企业,于2010年4月6日成立,总部位于中国北京,截至2018年3月31日,员工人数近1.45万。 2010年8月及12月,小米发布了基于安卓系统深度定制的第三方固件MIUI及首款移动应用米聊。2011年8月16日,小米正式推出了其第一款硬件产品——小米手机(一代),开创了以互联网线上抢购高配置、低售价的智能手机销售模式。 通过旗下生态链品牌MIJIA(米家),小米的产品线从智能手机及耳机、移动电源等手机周边产品和音箱、手环等相关移动智能硬件,扩展到智能电视、机顶盒、路由器、空气净化器、电饭煲等家居消费产品。截至2018年3月底,小米已进入全球74个国家和地区的市场,并在其中15个市场智能手机出货量名列前五。 2012年,小米全资买入北京多看科技有限公司,进入电子书阅读领域。多看阅读是旗下网站,并有相应的App。2018年,业界传闻小米有计划生产电子阅读器。 2018年5月3日,小米正式向香港交易所提交IPO申请[6],于2018年7月9日以同股不同权的方式挂牌上市,并计划于7月23日纳入恒生综合指数。 2018年11月19日,美图公司与小米集团宣布达成战略合作伙伴关系,合作期限30年。

推荐文章
暂无评论
暂无评论~