Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

历时四年,Rokid走上了一条怎样的硬件之旅?

准备了整整四年的 Rokid 发布会都有哪些亮点?

这是 Rokid 成立以来举办的首场发布会。

「我们为今天准备了整整四年。」公司创始人兼 CEO 祝铭明这样说道。

2014 年,祝铭明离开阿里出来创业,用他的话说,「从公司成立的第一天团队就一直致力于探索人与科技的交互方式」,并将公司的研发进程定义为 Home AI、Portable AI、Personal AI 三个阶段。

而公司的第一个产品就是面向智能家庭场景的机器人 Rokid Alien,当时,这个外形酷炫、功能丰富的产品卖价达到 5280 元,消费者望而却步,最终以一个不再量产的「收藏品」收场。

「走的有点太快了」,祝铭明说。

2016 年,公司转向智能音箱市场,推出第二代产品 Rokid Pebble,也就是后来大家所熟悉的月石智能音箱。

「在经历了尝鲜之后,大家一定会买一个跟自己的调性符合的产品。我们就想给大家看看,为用户和品质付出的公司终有一天是可以站住脚的。」祝铭明称,截至目前,Rokid 已经与用户完成了 1 亿次交互。

从 Alien 到 Rokid Pebble,代表 Rokid 在 home AI 阶段的探索,而接下来,Rokid 要用便携智能音箱 Rokid Me 和 AR 眼镜,完成向 Portable AI 的进阶。

在祝铭明看来,Portable AI 商用化的时间节点已经到了。

按计划前进,Rokid Me

外观上,Rokid Me 的双面圆弧造型延续了 Rokid 系列产品的一贯风格,大约为一听可乐的重量。

音箱内置了若琪语音助手和 6 个麦克风阵列,能够实现 360 度、5 到 10 米远场拾音。同时搭配 4000mAh 大电池,能够保障 8 小时以上的连续使用,有银、粉、蓝、紫四色可选。

在功能上,Rokid Me 搭载了声纹识别技术,用户可以通过摇一摇、翻转等操作让其完成切歌、暂停等任务,还支持蓝牙电话并加入了一款游戏。 

在售价方面,Rokid 继续走「不卖产品、卖品质」的策略为其打出了 799 元的价格,并将于一个月后的 7 月 26 日正式开售。

在此基础上,Rokid 还希望从一个「制造者、生产者」升级成为一个「分享者」。

「我们会把对产品、技术、用户、市场的理解以及对整个行业和生态的理解分享给合作伙伴。那么有人会疑惑我们是 toB 还是 toC?其实我们还是 toC,但这个 C 是 Community(社区)。」祝铭明补充道。

在被问到与百度语音交互平台 DuerOS 的对比时,他表示,大公司往往希望在生态圈中占据主导地位,圈里的开发者需要按规矩行事:

「我不太希望大家把 Rokid 变成一个我搭台,你唱戏,我收租金的地方。我希望我们能更像一个社区的组织者,我们一起搭台、唱戏、分利润。作为组织者,我们会给大家一些先天的好处和贡献。这就是社区的分享者跟平台的搭建者不一样的地方,也是很多合作伙伴放弃其他平台而找到 Rokid 合作的原因。」

祝铭明透露,NXP 将于 Rokid 展开合作。

做 AI 芯片,毋庸置疑

「我们并不想被理解成做智能音箱的,」祝铭明说。

Rokid 四年磨一剑的重头戏并非 Rokid Me,而是一块 AI 语音专用芯片,名为 KAMINO18,由杭州国芯为 Rokid 定制而成。

此前,云知声、思必驰等智能语音技术公司都陆续推出了自家芯片,试图借此构建一个完整的生态闭环。

「做语音的公司会不会做芯片?这是毋庸置疑,是一定会做的。但 Rokid 芯片最大的区别在于,它是一个完整的解决方案,并不是一个简单的语音信号处理。」祝铭明说道。 

据了解,KAMINO18 内部集成了 ARM、NPU、DSP、DDR、DAC 等多个核心元件,大幅度提升了芯片整体集成度,大小仅与一元硬币相当。

「如果要给 KAIMINO18 下一个定义的话,那这是一颗全能之作的芯片,它内置了全部的语音 AI 算法功能,并具有高性能、高集成度、低功耗和低成本的明显优势。」Rokid 北京 AI 实验室负责人高鹏介绍道。

据了解,KAMINO18 可以支持智能音箱及儿童故事机产品领域,结合了相控阵技术、CTC 模型、自定义唤醒词、离线语音指令、低功耗唤醒等 Rokid 最新算法。

在整机工作状态下,搭载 KAMINO18 的产品功耗可降低 30% 到 50%。与此同时,研发人员也在基于 KAMINO18 开发全新的 AI 功能,例如离线语音合成、离线声纹识别等。值得一提的是,这款 AI 芯片的整体成本低于市场主流通用芯片方案 30% 以上。此外,KAMINO18 还将支持 Amazon Alexa。

祝铭明透露,目前 Rokid 芯片已经被订出去几百万片了。发布会现场,喜马拉雅就宣布其儿童智能音箱晓雅 Mini 将成为使用 Rokid KAMINO18 的外部产品。

AR 眼镜,量产可期

「我们不仅仅做自然语言的交互,一直也在做着一些视觉领域的探索。」祝铭明说。 

事实上,公司发布的第一款产品 Rokid Alien 上就搭载了一个 1300 万像素的摄像头,能够实现面部、体态以及环境的识别。公司内部也有一个视觉团队在尝试视觉技术上的研发与探索,但一直苦于没有找到合适的使用场景和载体。

今年年初,Rokid 携 Rokid Glass 原型机亮相 CES 2018。在这之后,团队经过 5 个多月的时间,终于在发布会上拿出了量产产品 Rokid Glass。

Rokid 首席设计师兼美国产品研发负责人姜公略介绍,新版 Rokid Glass 延续原型机的一体化设计,整体体积缩小 40%,采用合金边框取代之前的塑料材质,更易散热。

在光学设计上,Rokid Glass 使用单镜片 AR 光学技术,光效率达到 50% 以上;硬件搭载高通骁龙 835 处理器,搭配 1300 万像素光学防抖、惯性传感器以及导音技术和麦克风阵列。 

在人体工程学方面,Rokid Glass 可以适应 90% 以上用户的头型和瞳距,吸附式矫正镜片让近视用户也能够正常佩戴。整机重量为 120 克,仅为微软 HoloLens 的四分之一。

不同于原型机的手势识别,Rokid Glass 在镜腿增加了新的 Touch Pad 和两个物理按键,用户可以通过左右滑动以及点击进行操作。在续航能力上,整机使用时间能够超过 6 小时,待机时间长达 60 小时。

功能方面,Rokid Glass 具有人脸识别、物体识别、室内导航、语音识别等能力,可以用于社交、安防、零售、医疗等场景。基于 WiFi 定位技术,Rokid Glass 还可以实现商圈内部一米范围内的精准定位。 

尽管从功能上看这款 AR 眼镜似乎更偏向于 toC 场景,不过姜公略表示这更是一件 toBtoC 的事情:

「对于 toC 还是 toB 并没有一个定论。toB 场景要做很多定制化,需要了解非常小的行业内的需求,这是很好满足的,但它无法跨越到更大的市场。我们想要做一款 toC 的眼镜,它难度更大,也可以跨越到更大的市场。现在已经有很多的 B 端用户都想要采购我们的眼镜,如果我们把眼镜卖给商场可以说是 toB,商场再把这个眼镜带给它的用户其实就是 toC。问题在于,如果用户不喜欢戴那么商场也不会用这个眼镜。」 

据了解,此次发布的 Rokid Glass 将于今年年底投入量产。

但 Rokid 迈向 AR 眼镜的这一步,也难免再让人联想起最初的 Rokid Alien 。而这一次,「探索者」能否匹配「让 AI 技术能快速走进千家万户」的目标?

产业人工智能助手智能音箱
暂无评论
暂无评论~