Mars编辑

云知声发布多模态AI芯片战略,同步曝光三款在研芯片

云知声发布多模态 AI 芯片战略与规划,同步曝光三款在研芯片,包括第二代物联网语音 AI 芯片雨燕 Lite、面向智慧城市的支持图像与语音计算的多模态 AI 芯片海豚(Dolphin),以及面向智慧出行的车规级多模态 AI 芯片雪豹(Leopard)。

继去年 5 月在行业率先推出首款面向物联网的 AI 芯片——雨燕(Swift)及其系统解决方案之后,1 月 2 日,国内领先的人工智能企业云知声在京召开新闻发布会,正式公布了其多模态 AI 芯片战略与规划。会上同步曝光了其正在研发中的多款定位不同场景的 AI 芯片,包括第二代物联网语音 AI 芯片雨燕 Lite、面向智慧城市的支持图像与语音计算的多模态 AI 芯片海豚(Dolphin),以及面向智慧出行的车规级多模态 AI 芯片雪豹(Leopard)。

5G 推动 AIoT 落地,多模态 AI 芯片成必然

云知声创始人/CEO 黄伟认为,当前我们正处于 5G 爆发的边缘,5G 与人工智能的结合将真正促使万物智联(AIoT)的落地与实现。可以预见的是,未来巨量的多维数据(如语音、图像、视频等)集中处理与边缘式分布计算的需求,势必将进一步挑战 AI 底层支持硬件——芯片的计算能力。

与此同时,AIoT 场景下人工智能应用对于端云互动有着强需求。强大的云会让端能力更强,而强大的端则可提升数据处理的实时性和有效性,进而增强云的能力。二者需要紧密结合,这要求对芯片设计和云端架构进行统一考量。传统的通用方案架构由于在高实时性、高智能化场景中的算力有限,且无法平衡好成本、功耗、安全性等诸多现实需求,因此具备多维度 AI 数据集中处理能力的多模态 AI 芯片将成必由之路。

黄伟同时指出,面向 5G 万物智联时代,人工智能服务需提供更加场景化的解决方案,云+芯一体化的服务模式将成为行业主流。基于此,他进一步对传统 SOC(System On Chip)概念提出全新定义,其中 S 代表不同的 AI 服务能力即 Skills,O 代表云端与边缘侧的互动 On/Off Cloud,C 代表具备智能处理能力的 AI 芯片。

从 IVM 到雨燕,云知声的造芯之路

云知声 2014 年开始切入物联网 AI 硬件芯片方案(IVM),并于 2015 年开始形成量产出货,其中家居领域客户覆盖格力、美的、海尔、长虹、海信、华帝等几乎所有国内一线家电厂商。在深入场景提供服务的过程中,为弥补通用芯片方案在给定成本和功耗条件下的能效比问题,以及在边缘算力、多模态AI 数据处理方面的能力短板,2015 年云知声正式启动自研 AI 芯片计划。

去年 5 月 16 日,云知声正式发布了旗下耗时近三年自主研发打造的首款物联网 AI 芯片。该芯片采用云知声自主 AI 指令集,拥有具备完整自主知识产权的 DeepNet1.0、uDSP(数字信号处理器),并支持 DNN/LSTM/CNN 等多种深度神经网络模型,性能较通用方案提升超 50 倍。

发布芯片后仅四个月,云知声便选择将基于雨燕的解决方案进行开源,于去年 9 月正式推出智能家居、智能音箱的两套标杆解决方案。通过“云端芯”结合,提供给客户与合作伙伴面向具体场景的软硬件一体化 Turnkey 解决方案,可让客户站在更高的设计起点、以更低的成本,在更短的时间周期内打造出更稳定可靠的产品。同时,开源的方案也可确保客户基于已提供的 AI 能力自行设计其它各种长尾产品形态,构建更为丰富的 AIoT 生态。

目前,基于雨燕芯片的全栈解决方案已导入的各类方案商及合作伙伴已超过 10 家,包括美的、奥克斯、海信、京东、360、中国平安、硬蛋科技等,相关产品最早将于 Q1 量产上市。

物联网 AI 芯片的多模态演进之路

在第一代 UniOne 芯片雨燕的发布会上,云知声联合创始人李霄寒曾指出, UniOne 并不是一颗芯片,而是一系列芯片,代表了云知声对于物联网 AI 芯片发展战略的整体构想。在今日举行的云知声 2019 多模态 AI 芯片战略发布会上,李霄寒再次从三方面论证了物联网多模态 AI 芯片的必要性。他认为,当前物联网产品线的 AI 芯片越来越明显地体现出三个趋势:

  • 首先是场景化。芯片设计正在由原来的片面追求 PPA ,即性能(Power)、功耗(Performance)和面积(Area)逐渐演变成基于软硬一体,甚至包括云端服务的方式来解决某个垂直领域的具体问题,芯片本身上升成为整个解决方案中的重要部分,而非唯一;

  • 其次,端云互动。物联网的不同应用场景下,海量终端设备要实现功能智能化必须端云配合,即形成边缘算力和云端算力的动态平衡。端云互动的命题需要AI 芯片的强有力支持,进一步也深刻影响到芯片的设计,以及最终的交付;

  • 再者,数据多模态。在以 5G 驱动的万物智联场景下,芯片所接触到的数据维度将由原来的单一化走向多元化,芯片所需处理的数据也由单模态变成多模态,这对芯片尤其是物联网人工智能芯片的设计提出了新的挑战。

结合以上三点,李霄寒认为,物联网 AI 芯片的最终呈现形式将不再是一个单一的硬件,而必然是承载着边缘能力与云端能力的多模态AI 软硬一体解决方案。

云知声多模态 AI 芯片技术布局

为实现多模态 AI 芯片的战略落地,目前云知声已在加速技术布局,并在机器视觉方面取得飞速进展。其中,面向机器视觉的轻量级图像信号处理器已可实现在不依赖外部内存的情况下,在 30fps 的速率下实时对传感器的图片进行预处理,以进一步提高后续机器视觉处理模块的处理速度和效果。借助基于人脸信息分析的多模态技术,已可实现人脸/物体识别、表情分析、标签化、唇动状态跟踪等功能,可为产品交互和用户体验提供更多的可玩性和灵活性。

尤为值得一提的是,云知声多模态人工智能核心 IP——DeepNet2.0 的发布,标志着云知声人工智能处理核心由 1.0 语音时代全面迈入 2.0 融合语音、图像等处理能力的多模态时代。DeepNet2.0 可兼容 LSTM/CNN/RNN/TDNN 等多种推理网络,支持可重构计算与 Winograd 处理,最高可配置算力达 4T,达行业一流水平。目前云知声DeepNet2.0 已在 FPGA 上得到验证,将在 2019 年落地的全新多模态 AI 芯片海豚(Dolphin)上落地。

除此之外,在图像与芯片技术的产学研合作方面,云知声还与杜克大学所领导的美国自然科学基金旗下唯一人工智能计算中心——ASIC 达成深度合作,致力于算法压缩与量化技术与基于存内计算等的新计算架构研究,将进一步为云知声多模态 AI 芯片战略的推进夯实基础。

三款在研芯片曝光,2019 年启动量

在首款量产芯片雨燕已有大批客户导入,占领市场先发优势的背景下,2019 年云知声在芯片落地规划方面仍将保持积极态度。

李霄寒透露,在持续迭代升级现有雨燕芯片的性能与服务之外,目前云知声多款面向不同方向的芯片也已在研发中,包括适用性更广的超轻量级物联网语音 AI 芯片雨燕 Lite,集成云知声最先进神经网络处理器 DeepNet2.0,可面向智慧城市场景提供对语音和图像等多模态计算支持的多模态AI 芯片海豚(Dolphin),以及与吉利集团旗下生态链企业亿咖通科技共同打造的面向智慧出行场景的多模态车规级AI 芯片雪豹(Leopard)。以上三款芯片计划于 2019 年启动量产。

目前,依托在家居、车载等真实场景下丰富的产品经验,以及具备先发优势的 AI 芯片能力,云知声将业务覆盖到包括智能家居、智能汽车、智能儿童机器人、智慧酒店、智慧交通等诸多场景。未来云知声将持续发力多模态 AI 芯片,不断拓展技术与场景生态,以实现面向未来 AIoT 时代的全面赋能。

云知声
云知声

专注于物联网人工智能服务,拥有完全自主知识产权,是世界领先的智能语音识别AI技术企业之一。公司成立于2012年6月29日,总部位于北京,在上海、深圳、厦门均设有分公司。

http://www.unisound.com/
专栏二维码
产业物体识别深度神经网络AI芯片物联网云知声
1
相关数据
云知声机构

云知声成立于2012年,是一家专注物联网人工智能服务、拥有完全自主知识产权、世界顶尖智能语音识别技术的高新技术企业。总部位于北京,在上海、深圳、厦门设有分公司。自成立以来,发展迅速,备受人工智能行业及资本市场的广泛关注,累积融资近亿美元,合作伙伴数量也已经超过2万家 。

https://www.unisound.com/
重构技术

代码重构(英语:Code refactoring)指对软件代码做任何更动以增加可读性或者简化结构而不影响输出结果。 软件重构需要借助工具完成,重构工具能够修改代码同时修改所有引用该代码的地方。在极限编程的方法学中,重构需要单元测试来支持。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

物体识别技术

计算机视觉领域的一个分支,研究物体的识别任务

信号处理技术

信号处理涉及到信号的分析、合成和修改。信号被宽泛地定义为传递“关于某种现象的行为或属性的信息(如声音、图像和生物测量)”的函数。例如,信号处理技术用于提高信号传输的保真度、存储效率和主观质量,并在测量信号中强调或检测感兴趣的组件。我们熟悉的语音、图像都可以看做是一种信号形式。因此,对于语音、图像的增强、降噪、识别等等操作本质上都是信号处理。

动量技术

优化器的一种,是模拟物理里动量的概念,其在相关方向可以加速SGD,抑制振荡,从而加快收敛

推荐文章
铅笔道・产品经理
哈哈