Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

【投稿】聊聊那个在CES2016上获奖的Rokid

杭州的第一场雪,我约了两位朋友终于去了Rokid位于杭州的全球研发中心,见了Misa-Yoda。

001

我们是在Misa的咖啡馆见面的,他的行程很满,次日受邀要去美国,今天还有央视的纪录片采访,他给我们叫了三杯拿铁,就先等着他。

我和Misa的相识缘于去年李德毅院士组织的一次活动,彼时的分场主持是凯哥(余凯,地平线机器人CEO),介绍到Misa的时候,凯哥用动情的声音讲到“前阿里土豪、现Rokid创始人”,脑海中佩戴大金项链的PPT创业者的形象跃然欲出,但前排嘉宾席无人动弹,就看着他穿着一身硅谷标配、端着一杯星巴克从后排走上来。可能他天生不太喜欢这种场合,因为凯哥的邀请,出现在了这里。

事实上当时很多人会把他当作又一个PPT创业者,因为Rokid还没有任何产品出来,更多的是一些功能上的介绍,而他也很聪明,用德鲁克的话来做talk show的结尾:The best way to predict the future is to create it. 这似乎蕴含着他对Rokid的自信。嗯,还有点作。

那次活动之后,国内对人工智能的关注开始大热。很多形形色色的机器人公司开始出现,甚至很多和机器人八杆子关系打不着的公司也言必称AI,吵着要上市。同样的情景也发生在现在,我们笑谈引力波的发现将会导致波导股份[SH.600130]和引力传媒[SH.603598]的股价飙升。

一位前辈说,现在是信息爆炸的年代,信息泛滥之下获取真正的讯息是非常昂贵的。现在的创业者大多懂得融资、懂得商业模式、懂得迭代、懂得PPT、懂得卖萌耍乖来获取关注,我们也越来越难找到一家肯花心力来打磨产品的扫地神僧般的科技公司。之前我们谈互联网,谈O2O,浮萍于水,昙花一现,独角兽沦为了都教授。哦,我们不是Gartner,也难编出全新的词汇来解释一些旧事物。但在纷繁中,总会有打动人心的设计、打动人心的产品,以及一群打动人心的人,让你感觉温暖。

这个世界上有很多优秀的企业,诞生有自己独特的企业文化符号,但有一点是共通的:创造优质的产品。我相信Rokid也是这样一家公司,因为早在2014年Rokid就已经有了Prototype,汲汲近2年不间断的打磨测试,才有了今天我们见到的产品。这期间Misa的压力很大,好在他拥有成功的创业经历和不错的名声,很多投资人都愿意支持他。哎,这特么又是一家靠脸获得投资的公司。事实上也有很多人对他的行为颇有不耐,既然已经有了成功的创业经历和可观的经济来源,自由之后,还劳什么气力去创办一家前途未卜的公司?Misa的行为更多的被理解为一个成功生意人的虚荣心,赚了钱就幻想着自己是个改变世界的人。甚至在Rokid刚起步时,很多论坛活动在介绍Rokid的时候经常会把名字拼错,比如Robokid(萝卜娃?)、Rokit(你丫是工具包配件吗?)、Rokd、Roker、Roket(你咋不上天呢?)等等,每每和Daniel聊起来也是无奈的摇摇头,不过现在没有人再拼错了,这是R-o-k-i-d,Rokid(若琪)。

那我们先来看看Rokid,一个产品最能看出创始人的追求所在。

003

这是一款基于深度学习的产品,采用自然有机曲面设计(你明白这种造型生产有点麻烦、这种材料让你摸着感觉很爽就可以了),而双侧提供了滑动触摸感应,可以控制音量和亮度,是一种非常自然的交互方式;采用了1300万像素的高清摄像头,支持手势识别;而底部配有8颗麦克风阵列,360度全向高灵敏度麦克风阵列,全向拾音,同时AEC自身音源消除机制可以过滤掉多余的杂音,语音交互感觉也很棒;4颗全频扬声器+2颗重低音辐射器,360度全向高品质音响系统,让你的耳朵也难挑剔。更多体验可以爬官网(rokid.com)小测。等一下,抛开这些专业的介绍,我们更想了解这些意味着什么?

这意味着一个全新的智能管家,只要你在十米内(相信我,你的房间绝对在这个范围内),就可以轻松唤醒Rokid,以后你起床不再喊妈,而是直接喊若琪。若琪,今天天气如何?若琪,帮我点一首吴亦凡的歌吧?出色的语音识别和语义理解可以让Rokid在极短的时间(2-3s)内完成相应的操作。对语音交互非常致命的一点就是环境噪音,在现场测试Rokid这一点时,发现在10人左右的房间(约90-100平米)内,有狗叫、有四五个人的围绕着Rokid在聊天,Rokid依然可以寻找发出指令的声源,这很有趣,你只要喊一声:若琪。那个闪烁的小圆圈就立马像一只眼睛一样面对着你(优先接受你的指令),一眨一眨的,配合立体准全息投影,星河璀璨,感觉充满了灵性。

这还没完,Rokid头顶上的摄像头可不是吃素的。很多人都有起夜的习惯,但是摸黑找房间灯开关很麻烦,Rokid可以根据你的运动进行感知,自动亮起,这样你就不用担心摸黑的问题,而且Rokid选用的是led光源,透过壳体后,光线也变得更为柔和,更适应人、亲近人,这也是Rokid的匠心独运之处,从这细小处开始一点点打磨,可能你会觉得这就是个光源而已,但真的,当你睡眼朦松时,你的眼睛会告诉你遭遇到刺眼灯光和柔和灯光的不同。另外,你还可以借助这个摄像头来进行手势识别遥控操作,比如换首歌什么的,晃晃手,就跟现在的人机交互电视一样,轻松方便,能动手就尽量不吵吵。

值得一提的是,Rokid唤醒只需要2个音节,而同样苹果的Siri则需要3个音节,没有体验过的话可能都不会察觉出这二者的区别。这么来讲,Siri的设定要求你每问一次问题前,你需要喊一遍:Hey, Siri(3个音节),她回答之后,你需要再喊一遍Hey, Siri,她才能再回答,如此反复,没几回合你就觉得很无聊了,这就像你面对着同一个人不停的打招呼一样,看起来真的很傻,这或许就是Siri未能成功铺开的原因;而面对Rokid,你只需要喊:若琪(2个音节)即可,很自然,你喊多少遍都觉得还好,因为你只是在唤一个人的名字。这个微小的进步也从侧面说明了Rokid在语音交互方面的扎实功底和精益求精的工程师情结。在这一点上,Rokid可以叫板苹果,嗯,我脑补一下若琪(Rokid)和思睿(Siri)两大美女近身肉搏的画面… 事实上若琪叫起来(错,是听起来)的声音真的很舒服,这并不是某个机械的单调声音,而是一种颇为柔和饱满的女声。当然,好的产品离不开内容,你可以在Rokid上播放任何你喜欢的节目,比如喜马拉雅FM等。

半年前写得一篇文章中,我有讨论过未来智能家庭的中枢该是落在哪里?当时用Jibo(MIT)和Buddy(Blue Frog)做了样例分析,一个判断就是在智能机器人。人们希望的智能不只是贴身,而是贴心。Rokid不光可以在你的呼唤中给你回应,按照你的需求为你点歌、点节目、答疑等。未来呢?我希望Rokid还可以帮我提前热好洗澡水、调整灯光亮度、代接电话等基础功能,还会在我外出时护卫家,当然,这一切的一切,都是基于我个人的生活习惯(生活数据累计),而Rokid,就是一个充满可能的平台。

2016年1月20日,首批100台Rokid的预定火爆大出人们预料。由于申请人数剧增,从上午11点开始,服务器就出现了三次高峰崩溃,小伙伴们对Rokid的热情非常高涨,Rokid团队忙碌之余也倍感欣慰,但这也是一种压力传递,如果Rokid并没有做到所想中的那么好,那么这一切也只是一阵风。庆幸的是,Misa一直都很坚决要把产品做好,哪怕推迟了一年多才让Rokid面世,所以我们现在看到的Rokid才能在这么多智能机器人当中脱颖而出。此外,Rokid相继在硅谷设立美国公司、在北京设立了研发中心。

Rokid诞生的那晚,看着这两张照片,突然觉得这个看起来很作、总喜欢坐在地板上的荒野大镖客(念piao的自觉去面壁),嗯,还挺赞的。后来一位省报的记者朋友托我想要去采访Misa,他回复说:报道产品可以,本人就免了。一颗低调内向腼腆传统保守无缝的蛋,Misa曾这样自嘲。其实了解Misa的人都知道,他做过很多有意思的事情,而且做的都还很不错,UC Berkeley的Ph.D,还掌管过阿里巴巴最神秘的部门—M工作室。其他的,嗯,你去买一台Rokid问问就知道了。说到底,他更希望你记住的是Rokid,而不是Misa,如果你认可了Rokid,那么你就懂了Misa-Yoda(嗯,不要忘了后半部分)。

006

从IFR(国际机器人联盟)的推断来看,服务机器人是蓝海。很多机构认为服务机器人2C没什么前景,2B才是王道,也常常拿Pepper来做例子(Pepper是软银、阿里、鸿海合投的一家机器人公司的产品),但不菲的价格和高昂的维护费用让Pepper很难走入千家万户,目前中产阶级的崛起给了2C更多机会,那些单认为2B王道的就继续让他们2b吧。机会是好的,只是泥沙俱下,你很难发现那些真正做产品的,因为这之前太边缘了,并不是每个人都了解。

007

Y Combinator创始人Paul Graham认为改变世界的恰是这些浮游在边缘的人。我们毕业后都争抢着加入大公司,这意味着稳定、体面和高收入,大家分工协作,严肃认真活泼。而在创业公司,通常大猫两三只,小猫几乎没有,一个大脑把所有流程都做完,然后谋划怎么让投资人过来再加把火(顺便把哥几个的晚餐給报销掉)。虽然创业者常常感觉到压力山大,但这也正是创业公司胜出的原因之一:能够快速发现和满足客户需求。边缘人虽然在思想上更为自由,但是他们不得不受到某些因素的限制,因此只能做一些便宜、无足轻重的东西。而这两个特点,都是进步的希望:因为便宜的东西传播得更快,轻便的东西也发展得更快。相反的是,那些精英人士,内部人,几乎是被强迫去工作的,他们不会去建造花园里的小花棚,只能去建造那些大型艺术博物馆。这很好理解,比如一家大公司希望完成千亿目标的销售,那么他关注的市场必然至少是百亿级别的市场。一个花园里的小花棚,就算再可爱、再精致,也很容易被忽略;有些人,甚至会嘲笑这样渺小的存在。这些人知道你们不会嘲笑一座巨大博物馆,即使你并不是很喜欢。边缘人可以从小东西做起,即便是一些看起来微不足道的东西,这也是很好的。因为它足够小,就不容易出问题,也更容易发挥主观去创新,周期更短。最重要的学习其实就是通过一个小课题连着一个小课题这样做出来的,这些小课题你完成的越快,做得越多,你就会进化的越快。而互联网,让这一切机会变得更为平等。

渐渐的Rokid有了些名气,也有人问我Rokid是什么?当我想要回答这个问题的时候,脑海想到的却是那人、那狗、那墙上的球、那个尤达大师公仔、那座隐藏在西溪湿地里面的Misa咖啡馆、那个木工房、那辆摩托,嗯,还有那个对着首批100台Rokid做测试的软妹纸,哦,以及角落里拿着手机玩自拍的Misa。兴许这就是Rokid,我们探讨了太多的功能和应用,但都敌不过给你的直观感受和情景体验。

某天,你坐在一个温暖的角落,时间渐晚,倦意渐满,你呢喃着对着空气说了一句话:

你:若琪(Rokid),晚安。

Rokid(林志玲姐姐版的声音):晚安喽,我的小帅哥,明天要加油哦!Fighting!!

嗯,日文版再给我来一遍。。。

啊哈哈哈哈哈哈哈哈。。。

作者:察日苏(舜宇光学科技集团)。

*本文由作者原创投稿,文章为作者独立观点,不代表机器之心立场。

入门人工智能
暂无评论
暂无评论~