小米 AI 音箱到底是一款怎样的产品?

撰文 | 高静宜

2014 年 11 月,亚马逊智能音箱 Echo 横空出世,上市后经过不断的性能优化和产品迭代,目前其内置的 Alexa 语音助手已经拥有 1.5 万余项功能,同时销量一路攀升累计达到 1100 万台,占市场份额的 70.6%。亚马逊在智能音箱领域的成功为之后布局智能家居奠定了坚实的基础,也为后来者提供了一种新思路。在国外,谷歌、苹果等厂商紧跟其后,致力于瓜分剩余的市场。与此同时,国内各家公司在智能音箱的探索道路上也并不寂寞,阿里、喜马拉雅、小米、出门问问等公司纷纷投入智能音箱的研发,并相继推出智能音箱产品。其中,小米 AI 音箱凭借低廉的价格强势入局,引起了业内的广泛关注。

7 月 26 日,小米正式发布小米 AI 音箱。在外形上,小米 AI 音箱沿用了小米一贯的纯白色简约设计,高度 21.16 厘米,宽度和厚度均为 8.8 厘米,重 636 克。音箱顶部隐藏着环形阵列的 6 组高精度数字麦克风,360 度收音;同时采用波束成型技术,能够有效屏蔽干扰,可实现远距离声控。


 小米 AI 音箱


在内容上,小米 AI 音箱汇集了喜马拉雅、荔枝 FM、蜻蜓 FM、库克音乐、贝瓦儿歌、中国广播、听闻新闻、乐听头条、拿索斯等音频服务商内容,涵盖音乐、小说相声、儿童故事、广播电台等多项功能。另外,小米 AI 音箱还支持新闻、天气、闹钟、路况、算数、备忘、单位换算、股票、汇率、留言、查找手机等功能。除此之外,小米 AI 音箱不仅可以控制小米电视、扫地机器人、空气净化器等米家生态链设备,还能够通过米家智能插座、插线板等产品控制第三方家居设备。


 

小米 AI 音箱支持的功能


8 月中旬小米宣布开启首轮公测,首轮预约量在 24 小时内就突破 100 万人次,可以想象之后小米 AI 音箱正式发售时的热度。那么,小米为什么要打造 AI 音箱?这款 AI 音箱有什么优势?目前使用体验如何?现阶段研发到什么程度?为此,机器之心在 8 月 22 日小米举办的小米 AI 音箱媒体沟通会上,采访了小米公司联合创始人、小米电视负责人王川以及小米探索实验室总经理唐沐,并在现场体验了小米 AI 音箱「小爱同学」的功能。

小米公司联合创始人、小米电视负责人王川与小米探索实验室总经理唐沐


小米为什么选择入局智能音箱市场?

据小米电视负责人王川介绍,在四年前,团队就开始投入小米电视的研发。当时,团队发现视听体验的重要性,于是在三年前开始研发电视音箱。在这个过程中,小米开发了几款副产品,相继推出了小米蓝牙音箱和小米互联网音箱。小米互联网音箱在蓝牙音箱优良音质的基础上可以通过 wifi 接入互联网,能够收听成千上万首歌曲以及小说、儿童故事等项目。在这里,团队还加入了一个按键功能,让用户可以通过按键用语音搜索歌曲。据悉,当时这个功能的反响非常好,得到了用户的广泛认可。之后,为了进一步推进音箱的研发,团队开始思索下一代产品是否可以让用户省去按键的环节,直接用语音完成控制。于是,语音识别功能由近场改成远场,在互联网音箱的基础上,使用之前研发的硬件、底层软件、AI 服务等技术,开发了这款小米 AI 音箱。王川总结道:「本质上,我们的智能音箱是一步一步推进,小步快跑。先做声学,再做互联网,紧接着实现内容集成和人工智能语音的集成,有这样的过程才有今天的『小爱同学』。


事实上,小米 AI 音箱的诞生离不开之前团队在小米电视上的技术积累与打磨经验。今年 3 月 21 日,小米发布了人工智能语音电视 4A 系列,全面采用 AI 技术实现语音的的识别、理解并完成相应的功能。「我认为在电视上语音是一个刚需。」王川解释道,小米电视聚合爱奇艺、腾讯、搜狐、PPTV 等内容服务商的海量内容。内容丰富的同时,用户搜索就会成为困扰。相较于用遥控器慢慢翻页,用语音搜索是非常便捷的。基于深度学习模型以及海量数据,小米电视上市至今的几个月时间里,对用户意图识别的准确度从 80% 提升至 97%。这个过程中,算法的迭代与数据的积累对开发小米 AI 音箱奠定了夯实的基础。


技术研发过程中遇到的挑战?


尽管有小米电视方面的支持,在研发小米 AI 音箱的过程中整个团队仍然遇到了一些挑战。小米探索实验总经理唐沐表示,内容是打造智能音箱要解决的第一个问题。内容不是小米擅长的部分,所以在音乐版权上,小米尝试与腾讯、百度、虾米等版权方以及三大唱片公司展开合作。另外,王川作为目前国内最大的 KTV 系统提供商雷石的创始人,在这一方面也提供了相应的支持。其次,数据作为训练人工智能系统不可获取的要素,也是各家公司研发智能音箱的过程中都会面临的问题。「我们需要大量的用户,这样通过深度学习方法,系统才能利用语料数据不断提升。不过,我们也一定要谨慎,需要对用户体验负责。我们的目标是无论用户说什么,我们的产品都能理解,现在看来距离这样的目标还有一定的差距。」王川说道,「我们要用互联网的办法一步一步进行测试,直到至少 95% 的用户认为这个产品值得推荐、值得购买了,那个时候我们再真正推出这款产品。」


小米 AI 音箱由小米电视、小米大脑、小米探索实验室以及米家四个团队协作研发。到目前为止,小米 AI 音箱在内部员工范围内开展了接近 3 个月的内测。唐沐回忆,由于团队的工程师大部分为男性,在内测唤醒词时小米音箱的效果非常好。但是工程师拿到家中以后却发现,妻子很难唤醒音箱,这是由于之前没有针对女性语料进行优化。所以团队搜集了大量的女性唤醒语料来训练系统。此后,团队又发现小孩的唤醒存在问题,于是又在海淀教育局的帮助下搜集了 150 个孩子的语料进行针对性优化训练。唐沐表示,未来还可能会针对小孩开发单独的模块,在孩子唤醒音箱时开启儿童模式,让音箱做出适合儿童的内容和回复。「我们整个的内测就是这样,就是把小问题一个一个地解决掉,我们的系统也每天都在进步。」唐沐总结道。


另外,小米还开放了 1000 台小米 AI 音箱的公测计划。唐沐表示:「我们希望把音箱放在实际用户的使用环境中,这样才能收集到真正有价值的语料来改进产品。」他补充道,在选择公测用户的时候会设置一个门槛,尽量选取家里至少拥有十台以上小米智能家具设备的用户。这也有助于帮助小米打磨智能家居的控制效果。


王川曾多次在公开场合表示,小米是一家专注做硬件的互联网公司,只关注自己擅长的部分。他认为,小米是一家开放的公司,每家都公司都有自己的基因和优势,在小米无法做到极致的领域,小米会选择与垂直领域内的顶尖公司展开合作。目前,小米 AI 音箱已经搭载 40 余项功能,背后涉及的技术十分广泛。「我们的 TTS、ASR、NLP 以及唤醒技术都结合采用了不同公司的顶尖技术。另外,远场和近场识别环境不同,需要大量的语料去进行训练。好消息是我们并非从零开始,而是融合、集成了多家 AI 厂商的一流技术。所以虽然『小爱同学』还没有正式上市,但是它的成熟的在国内已经属于最好的了。」王川如是说。


今年 5 月 18 日,小米启动了水滴计划,向第三方开放人工智能语音能力和 SDK,也希望与开发者共同探索人工智能语音应用,打造一个合作共赢的模式,也能帮助小米 AI 音箱拥有更多的技能。


小米AI 音箱在购物方面做了哪些准备?


除了语音交互、智能家居控制,语音购物也是亚马逊 Echo 所具备的基本功能之一。它不仅支持语音选购商品、语音支付,还支持用户购买之前购买过的商品。无独有偶,2017 年 7 月 5 日,阿里推出的智能音箱天猫精灵 X1 也具备购物、缴费的功能。那么,小米是如何看待智能音箱在购物方面的能力呢?


唐沐认为,智能音箱购物还有一些比较大的门槛,目前来看有点难以逾越。首先,音箱没有屏幕,在这样的情况下让大家有购物的欲望并不容易。唐沐说:「我们自己的思考是说,其实也许未来音箱购物只在标品上面有市场、有机会。」所谓标品就是具有明确的规格、型号的商品,比如 250 毫升的水、小米手机 5S 等。用户经过比较简单的交互就可以确定买到全网最低价的标品,无需在多个产品中进行选择,也无需担心寄过来的物品存在品质上的差异。不过,人们在购物时往往存在到处看看的需求,音箱在满足这种需求上是比较吃亏的。


唐沐提到的另外一个门槛是支付,也就是安全性问题。如果放置在家里的音箱绑定了用户的购物账号,那么用户的家人也可以随意购物。假设用户的女儿年纪很小,如果她也知道可以通过音箱进行购买行为,那么就成为一种灾难。所以,智能音箱购物首先需要具备类似声纹验证这样的技术,然后才合适去做音箱的标品电商。「当然也有一些垂直场景,比如充话费,这种我们可能会先做起来。在音箱上市之后,我们会逐步推出电商方面的一些尝试,但是不会是大规模做这样的事情,目前来看还没有这个打算。」唐沐解释道。


王川补充道,小米欢迎京东、天猫将服务内置到我们的音箱上,一起去商讨、去尝试。「不过目前关于声纹的部分,小米还没有看到特别靠谱的方案,现在的声纹交互要达到安全级别还不太现实。不过,我觉得这也是一个演进的过程,相信未来可能会有一定的发展空间。」王川说道。


如何看待智能音箱领域的激烈竞争以及小米 AI 音箱的独特优势?


现阶段,智能音箱市场异常火热,对此,王川表示,这个市场还需要时间,智能音箱产品还需要打磨。「我认为这个行业的热度有点过高。今天亚马逊 Echo 在美国的成功也是经过两年内用户的不断使用,体验才不断提升趋于成熟。我认为只有用户用了以后,音箱才会越来越好。」他解释道,小米也并不是因为这个行业热才选择做这样一款产品的。小米想做的是感动人心、价格厚道的产品,出于这个角度,无论大公司或者别人做不做,只要小米认为这个产品有价值就会去做。同时,王川还担心如果智能音箱产品在不成熟的阶段就进入市场,那么如果用户体验差,口碑不好,就阻碍了这个行业健康发展,等于毁了这个行业。


在谈到小米 AI 音箱在激烈的行业竞争中存在的优势时,王川认为,首先,小米 AI 音箱的音质很好;其次,小米在人工智能方面技术相对成熟;另外,团队也在持续进行用户体验方面的优化与提升;而且音箱 299 元的定价也非常厚道。除此之外,王川表示,小米在上游供应链、渠道方面也具有深厚的积累和沉淀,这也是与友商的一大区别。


唐沐补充道,截至目前,小米已经有 6000 万台智能家居设备在运行,这使得利用音箱控制职能设备得心应手,具有得天独厚的优势。「这是其他竞品公司所没有的特质,也是较难迈过的门槛。事实上,我们也确实花了非常多的精力去让音箱控制好我们的智能电视、灯、风扇、扫地机器人等智能设备,实现对接,希望可以带给用户更加方便舒适的体验。这也是我们音箱区别于其他音箱的重要一点。」唐沐解释道。


在成本方面的考量,王川解释小米定价的逻辑有两点,一是音箱不亏本,二是追求低毛利率。未来,小米 AI 音箱在变现模式也有很多的可能性。王川举例小米电视的三种变现模式:第一,会员模式,即用户付费;第二,广告模式;第三,通过电视出售产品。迁移到音箱上,小米也会进行各种尝试。他认为,如果小米的音箱音质特别好,那么对于用户的付费转化率会有很大帮助。「我觉得今天中国的用户可能不太愿意为版权付费,但是会为体验付费。我们的核心是在保证用户体验的前提下再探索变现模式,现在我们的音箱还没有上市,未来还有很多的可能性有待我们去验证。」


提到国内外智能音箱市场存在的差异,王川表示,国外对于音箱的需求明显大于国内。「我认为在中国更重要的一个点在于智能家居。」王川说道,「智能音箱既要是一个好音箱,也是一个好助理,也是智能家居的中心,这中间不存在鸿沟。不过未来智能家居不一定只有一个语音中心。」对此,唐沐也表示了肯定:「也许有些东西会自然而然成为中心,也许永远都不会有一个中心,重要的是产品背后的服务与技术,这才是我们关注的重点。」


据王川介绍,之前亚马逊 Echo 团队已经来过三次,目前也在讨论共同做国际市场的可能性,不过这并不是小米音箱现阶段的重点。据透露,现阶段小米把语音研发的重点聚焦于普通话,未来可能会向方言和其他语种发展。

入门小米智能音箱产业智能硬件产品