Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

带屏智能音箱如何成为2019年新的增长点?

亚马逊推出第一款带屏智能音箱Echo show 以来,关于带屏智能音箱的讨论就没有停止过,除了屏幕外,带屏智能音箱与智能音箱还有区别吗?它们之间相同的技术又是什么?带块屏幕的智能音箱真的有市场吗 ?

据Strategy Analytics的最新研究显示,2018Q4出货量增长了95%,达到3850万台。这超过了2017年的总量,并使2018年的总量达到8620万台

Strategy Analytics总监大卫沃特金斯评论说:“智能音箱和带屏智能音箱在过去的假日季节再次成为最受欢迎的技术产品,我们估计全球有超过6000万家庭拥有至少一台设备。

“谷歌的Home Hub,亚马逊的Echo Show和百度的小度在家等带屏智能音箱受到消费者的欢迎,他们被视听结合的刺激所吸引”。

带屏智能音箱在2018年第四季度占总出货量需求的10%以上,预计到2019年它们将成为市场增长的重要推动力。 

也就是说,带屏音箱不仅有市场,还会成为2019年智能音箱新的增长点。

无屏的智能音箱让大家的生活进入语音交互的场景,而带屏智能音箱则是语音+视频交互的又一次场景升级。

那么,除了屏幕以外,带屏智能音箱与智能音箱还有没有别的区别呢?它如何成为2019年新的增长点呢?要想回答这个问题,先来看看国外的带屏智能音箱是怎么样的。

国外带屏智能音箱

Amazon Echo Show

2017年,亚马逊推出Echo Show,这款智能音箱有一个7英寸触控屏幕,下半部分是一个相当强大的扬声器。所有这些都放在一起,用户不仅能够清晰地接听视频电话和观看媒体,而且还能听到清脆明快的音质。

Echo Show依旧搭载了亚马逊的Alexa语音助手,所以你可以给它几乎任何你想要的命令。例如,播放歌曲,电视节目,设置计时器,在日历上创建活动。

亚马逊最早发布的echo不同,echo show 最大的卖点自然是它的7英寸触控屏,而且还配备了英特尔凌动处理器以及前置550万像素摄像头,可与其它的Echo Show用户进行视频通话。

值得一提的是,echo show 和去年推出的第二代echo show 使用的都是8麦克风阵列亚马逊设备和服务副总裁大卫·利姆普(David Limp)称,这是所有Echo设备中最先进的麦克风阵列,这意味着其可以实现更优秀的噪声屏蔽,更好地听到用户发出的指令。

Amazon Echo Spot

亚马逊还推出了一个带有小显示屏的Echo Spot,它的屏幕只有2.5英寸(480×480像素),在屏幕的顶部有一个摄像机的空间,整个设备的顶部有三个按钮,它们都与表面齐平,形成真正流线型的外观。

这款智能音箱几乎可以放在任何地方,比如,厨房的一个角落,床头柜等。虽然这款智能音箱很小,但是它内置亚马逊自己的Alexa语音助手,所以用户仍然可以用它进行视频通话和观看视频。并且,它也可以做任何其他语音助手的事情。用户可以设置一个计时器,询问天气,播放电影等等。

尽管这款智能音箱很小,但是,它采用的是环形4麦克风阵列,因此,在语音唤醒方面并不逊色。

Google Home Hub 

去年10月,谷歌召开硬件新品发布会,会上,谷歌发布了3款硬件产品,其中就包括了Google Home Hub。 

Google Home Hub是谷歌推出的首款带屏智能音箱,配备了7英寸LCD触摸屏、远场麦克风、环境光传感器以及15W扬声器,支持蓝牙5.0,并配发了绿、粉、白、深灰四种颜色。 

Google Home Hub内置谷歌语音助手,用户可以通过它语音获取日历、通勤信息、提醒以及其他个人信息。用户还可以在Google Home Hub上观看YouTube、YouTube TV以及其他视频服务。 

不过,与其他带屏智能音箱颇为不同的是,谷歌这款带屏智能音箱并没有内置摄像头,也不能进行视频通话,这是谷歌对于隐私考虑的结果。 

值得一提的是,这款带屏智能音箱是一个控制中心,它有一个新的家庭控制仪表盘(Home View),可以让用户看到家中智能门锁、摄像头、恒温器等的状态。 

Facebook Portal 

也许是带屏智能音箱刮的风太大了,连声称自己不会成为一家硬件公司的Facebook也坐不住了,去年10月,推出了一款带屏智能音箱Facebook Portal。 

Facebook推出的整个硬件系列包括两款产品,即199美元、10英寸的Portal和349美元、15.6英寸的Portal Plus。

Portal系列带屏智能音箱内置了亚马逊Alexa语音助手环形4麦克风阵列,除了大屏幕外,最大的卖点就是它的广角摄像头。 

广角摄像头采用了人工智能技术,可以识别身体形状,从而实现自动对焦,始终让用户处于画面之中,而无需调整设备角度,这个技术可以让用户在进行视频聊天随意走动,更加地方便。

关于Portal的另一个特点是,当用户不在通话或观看某种媒体时,Portal可以通过用户的Facebook个人资料幻灯片显示用户最喜爱的照片和视频。

JBL Link View 

去年的CES展上,JBL联合谷歌推出带屏智能音箱Link View,JBL Link View配有一对10W扬声器和一个8英寸触摸屏。它还有一个500万像素的前置摄像头,带有高清视频录制功能。内置Google智能助手,而不是亚马逊Alexa。 

JBL Link View的一个特点就是配备了相当不错的屏幕,但内部没有很多清晰度或清晰度,但是仍然可以使用它进行视频通话,观看视频等。

然而,JBL Link View真正突出的地方在于它的扬声器。JBL以制作高质量的扬声器和音响产品而闻名,因此,电影,音乐和其他媒体在这款智能音箱上会听起来非常棒。

其实,看了一圈国外的带屏智能音箱,目前,带屏音箱最大的卖点就是可以视频通话,观看视频,最多的使用场景还是在家庭,并没有探索出更多的落地场景,也就是说,目前来看,和不带屏的智能音箱并没有本质的差异。

如果用户家里已经有了智能音箱,那么,再次购买带屏智能音箱的可能性就会很小,因此,在2019年,带屏智能音箱需要做出更大的差异化,能让用户根据个人需求进行个性化定制,能扩展出更多的应用场景。

在技术上看,不管是智能音箱还是带屏智能音箱,最重要的技术之一都是麦克风阵列

麦克风阵列

麦克风阵列是一种功能与普通麦克风类似的麦克风设备,但它不是只有一个麦克风来记录声音输入,而是有多个麦克风来记录声音。简单来说,就是麦克风的排列组合。

麦克风阵列一般来说有线形、环形和球形之分,严谨的应该说成一字、十字、双L、平面、螺旋、球形等。

麦克风阵列可以根据需要或希望记录声音输出而设计成包含任意数量的麦克风,具体来说,可以有2个到上千个不等

然而,由于成本限制,消费级麦克风阵列的数量一般不超过8个,所以市面上最常见的就是6麦和4麦的阵型。

麦克风阵列对智能音箱至关重要,它的作用主要是语音增强、声源定位、去混响、单或多声源定位等。

亚马逊最早推出的智能音箱Echo就是环形6+1麦克风阵列,而它推出的第二代Echo依旧延续了第一代麦克风的设计,2017年推出的Echo show 则多加了两个麦克,为8麦克阵列。从上述图表可以看出,智能音箱大多都采用6麦克风阵列,采用双麦克阵列的较少。 

使用双麦克阵列最典型的智能音箱是Google Home,2016年,谷歌推出Google Home,与Amazon Echo相比,最大的区别就是麦克风阵列Amazon Echo采用的是环形6+1麦克风阵列,而Google Home只采用了双麦克阵列。

与多麦克风相比,双麦克风有它的缺点,主要是声源定位只能定位 180°内的范围,而环形麦克风阵列(不管是 4Mic、6Mic 还是 8Mic)都可以做到 360°全角度范围内的定位。 

与此同时,麦克风越多越容易实现更好的降噪和语音增强效果,手机和蓝牙耳机上的降噪功能可以使用双麦克阵列,因为距离近,受噪声干扰小。 

但是,智能音箱的使用场景大多在家里,环境嘈杂,距离又远,在定向声源信息,抑制无关噪声,保证真实环境的语音识别率方面,双麦克与多麦克相比,效果肯定会大打折扣。 

在国内,麦克风阵列也已经是智能音箱行业的“标配”,市面上大热的几款智能音箱,都是多麦克阵列,例如,阿里天猫精灵X1、华为小艺小艺、小米小爱同学采用的都是环形6麦克阵列,这样的麦克风阵列可以更好地实现语音唤醒、声源定位等功能。 

要想更好的接收声音,抑制噪声,麦克风阵列中的麦克风匹配至关重要,需要考虑三个方面:方向性、灵敏度和相位。 

方向性——麦克风的方向性是指它可以从哪个方向接收声音。麦克风是用来接收来自特定方向的声音的。有些麦克风只能接收单向的声音。还有一些麦克风是用来接收来自四面八方的声音,全方位的麦克风。 

在构建阵列麦克风时,所有麦克风必须具有相同的方向性。一个麦克风只能接收来自某个方向的声音,而另一个麦克风只能接收来自各个方向的声音,这将导致灾难性的、不平衡的录音。

除非有某种独特的情况会出现这种情况,否则这在很大程度上是不可取的。因此,麦克风阵列总是使用相同方向的麦克风。 

灵敏度——灵敏度是麦克风阵列必须匹配的另一个方面。灵敏度是麦克风在记录信号时获得的增益。在麦克风阵列设备中,灵敏度必须非常匹配,否则一个麦克风的声音会比另一个大,从而产生不平衡的录音。

相位——相位是麦克风阵列必须匹配的最后一个重要方面。相位是麦克风开始录音的时间的参考度线,也就是说,它决定了阵列中所有麦克风开始和停止录音的时间

如果麦克风有完全不同的相位,它们将在不同的时间记录信号。这将导致不同步的记录,同样,这在很大程度上是不可取的。

麦克风最好能同时记录信号,这样信号之间就不会有延迟。就像灵敏度一样,麦克风之间的相位差必须有一个最大的允许公差。这种差异通常是±1.5度,确保信号记录同时,可以统一记录。

在万物互联的今天,麦克风阵列技术已经越来越多地被应用到消费领域,随着智能车载、智能家居、机器人、可穿戴设备等热潮的兴起,语音交互越来越被用户所习惯,麦克风阵列自然也成为其中非常重要的前端技术。

总体来说,机器人、智能家居行业尤其是智能音箱,采用的以多麦克居多,这是因为,虽然多麦克相较于双麦克成本高,但是,在降噪和语音增强方面,自然是麦克数量越多效果越好。

结语

亚马逊带头推出带屏智能音箱,国外的谷歌、Facebook,国内的BATJ等也纷纷迎头赶上,推出自家的带屏智能音箱,智能音箱大战也由此进入了第二阶段。

但是,需要注意的是,目前的带屏智能音箱都大同小异,无非是屏幕的大小、麦克风阵列的选择、接入资源的多少等差异。

当下,带屏智能音箱的主要场景还是家庭,希望在未来,带屏智能音箱可以拓展更多的应用场景,可以实现基于用户需要的个性化定制。

声学在线
声学在线

产业带屏智能音箱
相关数据
Amazon机构

亚马逊(英语:Amazon.com Inc.,NASDAQ:AMZN)是一家总部位于美国西雅图的跨国电子商务企业,业务起始于线上书店,不久之后商品走向多元化。目前是全球最大的互联网线上零售商之一,也是美国《财富》杂志2016年评选的全球最大500家公司的排行榜中的第44名。

https://www.amazon.com/
相关技术
英特尔机构

英特尔(NASDAQ: INTC)是全球半导体行业的引领者,以计算和通信技术奠定全球创新基石,塑造以数据为中心的未来。我们通过精尖制造的专长,帮助保护、驱动和连接数十亿设备以及智能互联世界的基础设施 —— 从云、网络到边缘设备以及它们之间的一切,并帮助解决世界上最艰巨的问题和挑战。

http://www.intel.cn/
相关技术
华为机构

华为创立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。

https://www.huawei.com/cn/
语音增强技术

语音增强旨在通过利用信号处理算法提高语音的质量和可懂度。 主要包括1. 语音解混响,混响是由于空间环境对声音信号的反射产生的;2,语音降噪,干扰主要来源于各种环境和人的噪声;3. 语音分离,噪声主要来源于其他说话人的声音信号。通过去除这些噪声或者人声来提高语音的质量。现已经应用于现实生活中,如电话、语音识别、助听器、VoIP以及电话会议系统等。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

麦克风阵列技术

麦克风阵列(Microphone Array),从字面上,指的是麦克风的排列。也就是说由一定数目的声学传感器(一般是麦克风)组成,用来对声场的空间特性进行采样并处理的系统。 早在20世纪70、80年代,麦克风阵列已经被应用于语音信号处理的研究中,进入90年代以来,基于麦克风阵列的语音信号处理算法逐渐成为一个新的研究热点。而到了“声控时代”,这项技术的重要性显得尤为突出。

百度智能云机构

百度是全球最大的中文搜索引擎,是一家互联网综合信息服务公司,更是全球领先的人工智能平台型公司。2000年1月1日创立于中关村,公司创始人李彦宏拥有“超链分析”技术专利,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

http://www.baidu.com
奇虎360机构

360公司成立于2005年8月,创始人周鸿祎 2011年3月30日在纽交所成功上市 2018年2月28日,回归A股上市,上证交易所(601360) 是中国第一大互联网安全公司,用户6.5亿,市场渗透率94.7% 中国第一大移动互联网安全公司,用户数超过8.5亿 中国领先的AIoT公司,将人工智能技术应用于智能生活、家庭安防、出行安全、儿童安全等多个领域

http://smart.360.cn/cleanrobot/
小米集团机构

小米公司正式成立于2010年4月,是一家专注于智能手机自主研发的移动互联网公司,定位于高性能发烧手机。小米手机、MIUI、米聊是小米公司旗下三大核心业务。“为发烧而生”是小米的产品理念。小米公司首创了用互联网模式开发手机操作系统、发烧友参与开发改进的模式。2018年7月,工业和信息化部向与中国联合网络通信集团有限公司首批签约的15家企业发放了经营许可证,批准其经营移动通信转售业务,其中包括:小米科技有限责任公司。 2018年7月9日,正式登陆香港交易所主板 。

https://www.mi.com/
暂无评论
暂无评论~