产业资讯方案大厅机构大厅

大象声科

Elevoc

深度学习
http://www.elevoc.com

机构介绍

大象声科(深圳)科技有限公司,简称Elevoc,于2017年在深圳成立,是全球领先的机器听觉人工智能公司之一,致力于提供尖端的智能语音增强和语音交互解决方案,打造更自然的人机交互体验。 大象声科云集了一批来自世界顶尖机器听觉科学家和经验丰富的产品研发团队,基于多年对计算听觉场景分析理论(CASA)的研究,应用前沿的深度学习技术(DL),为智能手机、VoIP云通讯、可穿戴设备、智能车载、智能家居等行业,提供全球领先的智能语音增强和智能语音交互解决方案。 大象声科已经与Qualcomm,Intel,arm,CEVA,Cirrus Logic,Infineon,Rockchip和BES等国内外知名芯片厂商建立了良好的合作关系,成功服务于小米、OPPO、vivo、一加、中兴、努比亚、黑鲨、魅族、海能达、美图、猎豹移动、51Talk等客户。未来,大象声科将与合作伙伴们一道,推动产品智能升级,让人工智能更贴近生活,服务人民,造福人类。

1.公司定位及发展历史:

大象声科(深圳)科技有限公司,简称Elevoc,于2017年在深圳成立,是全球领先的机器听觉人工智能公司之一,致力于提供尖端的智能语音增强和语音交互解决方案,打造更自然的人机交互体验。


2.创始团队背景:

苗健彰:创始人 | CEO

•加拿大Spark Technology Inc创始人

•曾就职于RBC,IBM

•UBC软件工程学硕士

•西安交通大学通信工程学士


汪德亮教授:首席科学家 | 联合创始人

•计算听觉场景分析(CASA)奠基人之一,全球首位将深度学习应用于语音增强的科学家

•IEEE Fellow

•俄亥俄州立大学教授,感知与神经动力学实验室主任、杰出学者

•权威期刊Neural Networks 主编


张学良 :CTO | 联合创始人

•中科院自动化所模式识别国家重点实验室博士

•哈尔滨工业大学人工智能研究组硕士

•内蒙古大学计算机学院教授

•多年从事语音分离、增强算法研发工作


3.团队规模:

云集了一批来自世界顶尖机器听觉科学家和来自中科院、百度、阿里等知名企业和研究机构经验丰富的产品研发团队,团队规模目前有40人。

4.主营业务和商业模式:三种合作模式,覆盖产业链上下游

SDK软件包——为应用开发商提供语音增强和智能语音交互SDK软件套件,并支持特定应用领域的定向开发;

软核解决方案——为芯片厂商、智能终端、方案设计商等合作伙伴提供芯片底层算法植入;

硬件模组方案——为合作伙伴提供软硬一体的硬件模组及参考设计。


5.核心产品和技术优势:

软件:

Vocplus智能语音增强方案(Telecom/Headset/Gaming/RTC套件):基于计算听觉场景理论基础,应用深度学习技术,实现人声与背景噪声实时分离,提取清晰人声,让用户即使在强噪音环境下,也能畅享清晰的音视频通话

Vocplus Smart 智能语音交互方案:兼容主流芯片架构、硬件设计和声学结构,令人机交互体验更佳,助力品牌厂商打造精准自然的智能语音交互产品


硬件:

Elevoc智能拾音降噪通讯模组:不受限于噪声类型,无需依赖任何平台系统,只需对该降噪模组进行供电及音源输入,即可实现音频的实时降噪处理。

Elevoc智能语音交互模组:支持模拟麦1-2个/数字麦1-4个,支持众多语音平台,可快速实现语音识别、对话交互、语音技能、语音控制等功能,助力品牌厂商快速实现顺畅自然的语音交互体验


技术:(均已申请专利)

智能降噪:计算听觉场景分析+深度学习,实时分离人声与噪音

声纹识别:准确识别验证说话人身份,具有高识别率、高鲁棒性

语音唤醒:支持唤醒词定制,抗强噪声唤醒,轻量级,低功耗

回声消除:支持单声道、立体声回声消除,无延时处理音频数据

波束形成:灵活应用于不同阵列,结合深度学习有效实现降噪、去混响、去干扰、声源分离及定位

混响抑制:有效抑制由混响造成的拖尾现象,提升语音清晰度和可懂度

声源定位:准确计算目标说话人角度和距离,在强干扰和大混响下实现跟踪和语音定向拾取

啸叫抑制:实时智能监测啸叫并阻断反馈回路,抑制啸叫产生


技术优势和壁垒

凭借深度学习驱动的语音增强技术奠定了语音前端信号处理引领者的地位;依托算法、软件、硬件三个维度的技术纵深,为语音增强和智能语音交互提供先进的解决方案。

7.代表客户:

成功服务于小米、OPPO、vivo、中兴、一加、努比亚、黑鲨、魅族、海能达、美图、猎豹移动、51Talk等行业客户,覆盖80%以上的国内手机客户品牌,赋能手机、耳机、智能驾驶、智能安防、物联网等多个领域头部客户。

8.未来发展规划:

采用基础研究+产业结合+行业伙伴的模式,一方面,依托算法、软件、硬件三个维度的技术纵深,实现对手机、耳机、VoIP云通讯、智能驾驶、智能安防、物联网等行业实现覆盖;另一方面,通过产业链上游的合作伙伴如高通、英特尔、arm等芯片厂家的紧密合作,纵向在产业里做深。


产品及解决方案

大象声科·更多解决方案

Elevoc ENS智能拾音降噪通讯模组

通信及信息技术

Elevoc智能拾音降噪通讯模组:不受限于噪声类型,无需依赖任何平台系统,只需对该降噪模组进行供电及音源输入,即可实现音频的实时降噪处理

Vocplus Smart 智能语音交互方案

通信及信息技术

Vocplus Smart 智能语音交互方案:兼容主流芯片架构、硬件设计和声学结构,令人机交互体验更佳,助力品牌厂商打造精准自然的智能语音交互产品。

Vocplus智能语音增强方案

通信及信息技术

Vocplus智能语音增强方案(Telecom/Headset/Gaming/RTC套件):基于计算听觉场景理论基础,应用深度学习技术,实现人声与背景噪声实时分离,提取清晰人声,让用户即使在强噪音环境下,也能畅享清晰的音视频通话。

Elevoc VX智能语音交互模组

通信及信息技术

大象声科智能语音交互模组,集合了大象声科领先的AI智能降噪,回声消除,语音唤醒等语音交互核心技术。该模组可快速实现语音识别、对话交互、语音技能、语音控制等功能,不受限于噪声类型,能够轻松实现对用户指令的精确识别。软硬一体化的解决方案,助力品牌厂商快速实现顺畅自然的智能语音交互体验。

大象声科(深圳)科技有限公司Vocplus Smart 智能语音交互方案

自然语言处理信号处理语音增强基础理论通信及信息技术生活服务

Vocplus Smart 智能语音交互方案集成了大象声科领先的回声消除、声源定位、波束形成、混响消除、智能降噪、语音唤醒和声纹识别等核心技术,助力品牌厂商打造精准自然的智能语音交互产品。

大象声科(深圳)科技有限公司Vocplus Telecom智能通话降噪方案

语音增强通信及信息技术

Vocplus Telecom智能通话降噪方案,基于计算听觉场景分析理论基础,应用深度学习技术,首次实现了单通道实时语音和噪声分离,同时适用于多麦克风,实现语音增强,有效抑制环境中的各类噪音,大大提升音视频通话的语音信号质量。

SDK开发者套件

深度学习语音识别通信及信息技术

大象声科单通道语音增强方案基于计算听觉场景分析及深度学习技术,实现了单通道语音增强的实用化。其芯片级单音轨实时语音提取方案,基于人类听觉系统对环境声音感知和处理机理,采用深度学习算法进行降噪,有效的实现了噪音与人声的分离,实现通话过程中噪音抑制和语音提取、回声抑制、语音增强。SDK 封装使该技术可用于 IOS、Android等操作平台。

SDK 软件包

语音识别深度学习通信及信息技术

大象声科单通道语音增强方案基于计算听觉场景分析及深度学习技术,实现了单通道语音增强的实用化。其芯片级单音轨实时语音提取方案,基于人类听觉系统对环境声音感知和处理机理,采用深度学习算法进行降噪,有效的实现了噪音与人声的分离,实现通话过程中噪音抑制和语音提取。而通过 SDK 封装,该技术可用于 IOS、Android 等操作平台。

DSP算法包

语音识别深度学习通信及信息技术

大象声科单通道语音增强方案基于计算听觉场景分析及深度学习技术,实现了单通道语音增强的实用化。其芯片级单音轨实时语音提取方案,基于人类听觉系统对环境声音感知和处理机理,采用深度学习算法进行降噪,有效的实现了噪音与人声的分离,实现通话过程中噪音抑制和语音提取。显著提升强噪音环境下手机的语音质量,免提通话和使用耳机通话时的语音降噪尤为优秀。而 SDK 封装使该技术可用于 DSP 等操作平台。

硬件模块

深度学习语音识别文体娱乐

大象声科单通道语音增强方案基于计算听觉场景分析及深度学习技术,实现了单通道语音增强的实用化。其芯片级单音轨实时语音提取方案,基于人类听觉系统对环境声音感知和处理机理,采用深度学习算法进行降噪,有效的实现了噪音与人声的分离,实现通话过程中噪音抑制和语音提取。其智能语音解决方案,广泛适用于智能音箱、电视盒子等语音智能产品。