全球机器听觉解决方案供应商——大象声科获小米和高通创投数千万元战略投资

全球领先的机器听觉解决方案供应商大象声科(Elevoc)宣布获得小米和高通创投的数千万人民币的Pre-A轮战略投资。大象声科表示,该轮融资具有广泛重要的战略意义,将有利于强化上下游产业链,进一步赋能通讯、智能家居、智能车载、可穿戴设备、安防等行业客户。

大象声科于2015年创立于美国硅谷,目前总部位于深圳,是全球领先的致力于机器听觉的人工智能公司。公司云集了以俄亥俄州立大学国际著名学者、IEEE Fellow汪德亮教授为代表的人工智能语音交互领域优秀的科学家团队,依托算法、软件、硬件三个维度的技术纵深,为语音增强和智能语音交互提供先进的解决方案。

目前,大象声科已经成功推出了全球首款芯片级单通道人工智能语音增强方案,在不依赖物理硬件的情况下,有效实现了噪音和人声的分离,并在手机通讯行业率先进行了商用,开启了人类无噪音通讯时代。此外,大象声科将单通道语音增强技术与麦克风阵列结合,将多通道语音增强的性能也提升到新台阶,真正解决了语音前端处理的技术难点。

小米首席架构师、人工智能与云平台副总裁崔宝秋表示:“智能语音已经成了新一代人机交互入口的必争之地,比如小米AI音箱,让用户可以通过语音交互控制各种各样的智能设备、获取丰富的内容与服务,这就需要强大的机器学习算法来赋能。鉴于AI在语音以及其他领域的深度应用,我们将AI定为小米未来十年最重要的战略之一。 大象声科的技术团队基于多年对计算听觉场景分析的研究和积累,创造性地采用深度学习技术解决听觉领域中著名的「鸡尾酒会问题」,拥有全球领先的核心算法。我相信小米与大象声科的合作,一定会为小米以及小米生态链下一代系列智能语音产品带来更精彩的人机交互体验。”

高通全球副总裁兼高通创投董事总经理沈劲表示,“人工智能正在从云端向终端迁移,高通作为技术提供商,一直在积极地关注并加速在终端侧人工智能的布局,大象声科拥有业界领先的语音增强和智能语音交互解决方案,势必会让更多的终端设备受益于人工智能技术,加快终端智能化生态的发展。”

大象声科创始人兼CEO苗健彰表示:“ 虽然人工智能技术的发展已经取得了长足进步,但是要实现人性化的的语音交互还有许多关键问题有待解决,机器听觉就是其中之一。自创立伊始,大象声科便树立了为机器人打造智能耳朵的目标。大象声科在机器听觉理论研究上一直走在世界前沿,联合创始人汪德亮教授和张学良教授在该领域有超过20年的技术积累。特别是汪教授不仅是机器听觉领域的重要理论——计算听觉场景分析(CASA)的奠基人之一,还是全球第一位将深度学习应用于语音增强的学界泰斗。大象声科将依托自身行业领先的技术优势,整合小米和高通创投的战略资源,联合通讯、智能硬件、安防等领域的优质客户,共同将高品质和便利的人工智能服务带进千家万户。”

产业大象声科语音交互NLP创业公司小米融资
相关数据
人机交互技术
Human-computer interaction

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

机器学习技术
Machine Learning

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

机器人技术
Robotics

机器人学(Robotics)研究的是「机器人的设计、制造、运作和应用,以及控制它们的计算机系统、传感反馈和信息处理」 [25] 。 机器人可以分成两大类:固定机器人和移动机器人。固定机器人通常被用于工业生产(比如用于装配线)。常见的移动机器人应用有货运机器人、空中机器人和自动载具。机器人需要不同部件和系统的协作才能实现最优的作业。其中在硬件上包含传感器、反应器和控制器;另外还有能够实现感知能力的软件,比如定位、地图测绘和目标识别。之前章节中提及的技术都可以在机器人上得到应用和集成,这也是人工智能领域最早的终极目标之一。

深度学习技术
Deep learning

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法。观测值(例如一幅图像)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务(例如,人脸识别或面部表情识别)。 近年来监督式深度学习方法(以反馈算法训练CNN、LSTM等)获得了空前的成功,而基于半监督或非监督式的方法(如DBM、DBN、stacked autoencoder)虽然在深度学习兴起阶段起到了重要的启蒙作用,但仍处在研究阶段并已获得不错的进展。在未来,非监督式学习将是深度学习的重要研究方向,因为人和动物的学习大多是非监督式的,我们通过观察来发现世界的构造,而不是被提前告知所有物体的名字。 至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

噪音技术
noise

语音增强技术
speech enhancement

语音增强旨在通过利用信号处理算法提高语音的质量和可懂度。 主要包括1. 语音解混响,混响是由于空间环境对声音信号的反射产生的;2,语音降噪,干扰主要来源于各种环境和人的噪声;3. 语音分离,噪声主要来源于其他说话人的声音信号。通过去除这些噪声或者人声来提高语音的质量。现已经应用于现实生活中,如电话、语音识别、助听器、VoIP以及电话会议系统等。

机器之心
机器之心

机器之心是国内领先的前沿科技媒体和产业服务平台,关注人工智能、机器人和神经认知科学,坚持为从业者提供高质量内容和多项产业服务。

推荐文章
斯坦福大学实现高性能低功耗人工突触,可用于神经网络计算斯坦福大学实现高性能低功耗人工突触,可用于神经网络计算
微胖微胖
四大行中三家悄然注资某AI核心系统创业公司, 这是AI垂类技术创业不再「吃香」的一种预兆?|独家四大行中三家悄然注资某AI核心系统创业公司, 这是AI垂类技术创业不再「吃香」的一种预兆?|独家
微胖微胖
过去 24 小时的 8 件重大事件| AI Daily过去 24 小时的 8 件重大事件| AI Daily
微胖微胖
返回顶部