Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

四年摸索,这家B+轮AR公司看见杀手级产品就藏在行业链里

「我们经常会遇到的问题是,谷歌多有钱、工程师多牛啊,他们都没成功你怎么能成功?」

六年前,面向消费市场的谷歌眼镜横空出世。随之而来的,是市场对 AR 技术期待值的高涨,在当时的话题度完全不输如今的 AI 技术。

项目动用了谷歌最神秘的 X 实验室里的精英,打造出的这款增强现实型穿戴式智能眼睛,被媒体称为「划时代」的科技产品。

可好景不长,这个被寄予厚望的产品上市后却是「高开低走」:由于价格偏高、没有杀手级应用、设备频出漏洞等原因,人们不愿为其买单,谷歌眼镜最终逐渐淡出了公众的视野。2015 年,谷歌宣布取消谷歌眼镜项目,停止对外出售及产品维护。

尽管谷歌后来也表示并未真正放弃谷歌眼镜项目并尝试回归市场,但在这之后,AR 眼镜领域也并未出现真正打开局面的后继者。Snapchat 于 2016 年底推出了一款可以拍摄全景视频的 AR 眼镜 Spectacles,相比 Google glass ,它类似墨镜的设计和价格定位向 C 端用户靠近许多,但「塑料玩具感」造成销量也并不理想,接连爆出过滞销、积压库房等消息。

如此一来,这种研发成本和能力要求不低的行业还有机会吗?

谷歌眼镜的「颓势」让吴斐在创办 AR 公司亮亮视野的四年时间里,反复面对这样一个问题:

「谷歌多有钱、工程师多牛啊,他们都没成功你怎么能成功?」

但这家中国的创业公司甚至没打算走低价路线。今年年初,亮亮视野推出的新一代人工智能 AR 眼镜 GLXSS ME ,售价比 Google Glass 还高。

在他看来,「行业在早期要解决的是单一问题,在解决单一问题上,小企业和大企业还是有得一拼。谷歌的方向没有错,问题是谷歌一开始就把产品放到消费市场里,大家预期太高结果谷歌自己的动作变形,这才是真正把谷歌带向深渊的根源。同时,也没有任何一个真实的需求能被落地解决,所以整个行业才会又回归到瓶颈阶段。」吴斐说。

在行业扎根多年,他对 AR 眼镜的看好没有打过折扣,但从几个人靠着四面白墙开始,一路伴随着这些大公司「跌宕起伏」的阴影,直到 2017 年底实现了盈亏平衡,他们才切实从市场上认识到,工业制造业、医疗、安防这些传统场景里隐藏着真正的机会。

我们解决的是「第一视角」交互需求

AR 眼镜究竟是不是一个伪需求?什么样的产品形态是贴近行业用户需求的?

吴斐一直认为,其实 AR 眼镜的底层逻辑非常清晰——

从最原始的卡带机到计算机再到后来的触屏手机,人类一直存在方向明确的需求,即更加自然、通畅的交互方式。在他的未来设想里,人们可能甚至无法分清戴上眼镜是真实的世界还是拿下眼镜才是真实的世界。

这被吴斐定义为「第一视角」交互革命,也是公司的底盘。

「大家都说一个公司的产品要聚焦,很多时候大多数公司容易聚焦到某一项技术上,例如手势识别、人脸识别等。可当我们在迭代过程中却发现,产品应该聚焦什么?其实是聚焦问题。」吴斐解释道。

围绕解决「第一视角」的问题,亮亮视野的所有技术方向开始极度收敛。

一开始,亮亮视野发布的也是一体机,从产品、技术上去推导,对于客户体验来说,没有线的一体机才是一个完整的产品。但想象一下,普通眼镜 20 g不到,人如果戴 1 斤多的东西在头上完全不可能长时间使用。

当时,市面上多数产品都是双目或头盔式,吴斐认为这种设计多半是想集成更多元丰富的交互,本质上考虑的都是怎么把 PC 端那样的体验放到眼前,比如按键手抓过去这种设计。「我们回忆一下用 Window CE 系统的多普达手机,点开始、菜单、文件、excel点一个小格,真正把电脑操作搬上了手机,谁改变了它?触控,手指是圆的,更符合人手的交互习惯,而眼镜一定是一个不同的交互模式。」

「反观我们,当我们聚焦第一视角的交互体验时,我们发现之前的决定是错的。」吴斐说,「今天的技术可以在分体式产品上提供一个不错的体验,那么与第一视角强相关的要放在眼镜,而与第一视角交互行为弱相关的应该可以交给手机。」

移动,是 AR 眼镜最重要特性之一,而要做到这一点,首先产品就要足够轻。

GLXSS ME 采用分体式设计,重量为 33.4 克,大约与一幅普通眼镜的重量持平( Google Glass 重 50 克)。

选择「轻」背后是一系列受限条件,是对产品硬件及工艺要求的高要求,要不断对各方面进行取舍。

比如第一个限制,所有的器件都要足够小,功耗还要足够低,在计算上在功能上在很多器件上都要做取舍,Hololens 舍弃的是体积,还有一些产品舍弃的是功能。

「我们认为每一克都是很有价值的,所以是 0.1 克、0.1 克往下抠。」吴斐说道。为此,亮亮视野的所有研发与设计都要遵循「最小系统」的原则,把一切不必要的部件都去掉,包括一些阻容感、塑料,这样做可以在不影响性能的情况下减重。

以光学显示环节为例,业内存在多种技术路线,每个方向都在快速发展但未来究竟哪种方案会胜出还未可知。在吴斐看来,无论哪种方案,最后成为行业标准的技术并不一定是最好的或最简单的,应该是最顺应行业需求的。

另一方面,「移动性」等同于实时性,也就意味着 AR 眼镜在感知与交互能力上的挑战。

不管使用者移动到任何场景下,眼镜都需要及时作出反应,比如,他是一位物业管理人员,当他走到电力设备面前再走到物业管理中心,眼镜提供的不同指示和功能需要即时切换。这背后要求的是,系统能通过环境感知迅速触及云端,拿到数据再反馈到眼镜上。换句话说,这考验的是 AR 眼镜的现实感知能力,即系统计算能力。

GLXSS ME 选择搭载英特尔的 AI 芯片,基于端计算的神经网络推理框架为眼镜赋予视觉能力。

吴斐认为,就像 Linux 嵌入式的发展成就了安卓,安卓带上精简指令集最后才有了整个安卓手机的生态,第一视角交互革命一定是一样的,第一步是拿矢量计算器完成现实的感知、识别,接下来整个业界去做基于高实时性系统的操作系统。

「目前感知还有很大的提升空间,我们的能力更多是在软件、算法架构上面,在前端嵌入式计算环节投入比较多,非常多的人在这上面做架构、底层的改造,上层的应用优化。」吴斐说道。

他透露,公司从 2016 年初就开始着手布局 AI 领域的技术研发并组建团队,目前该团队大约有四十人,从事底层架构的改造以及上层的应用优化等方面。「我们现在用 ResNet50 层模型从检测、跟踪到识别一个人脸可以做到 200ms 以内。」

中国式生存之道

即便是把眼镜做轻,可以长时间佩戴,但这些 B 类客户拿来「看」什么?

「刚开始产品的试用反响不是很好,很多人把它当成一个噱头,后来我们按行业、领域找客户,跟客户一起去推导出合适的应用场景,」吴斐告诉机器之能,很多公司是有技术再把技术给到客户用,也有公司完全听客户的需求做产品,这两种都会遇到很大的问题,比如很多时候,客户的需求点并不成熟,直到产品做出来可能才了解并不是他们想要的,这样的迭代方式非常耗时耗精力。

从 2015 年开始,团队跳进行业里,去做大量 to B 的验证工作,亮亮视野形成了一套底层逻辑靠技术推导、产品需求向客户深度挖掘的双轮驱动体系。

团队曾在物流公司里同工作人员一起做分拣,去理解物流业工作体系,从找分拣流程中找业务机会,电力、石油、安防、医疗等领域也是如此。

「我们的产品和开发都会跟他一起干活,比如跟医生进手术室观摩等,我们不仅听他告诉我我要什么,而是看他真实用的时候感受是什么。我们发现他们的需求有几点,首先需要非常舒适的佩戴,要有很强的感知能力,另外他们需要的是一套系统。」

GLXSS Live第一视角人机协作平台服务架构

当时,大部分AR公司瞄准的都是硬件,亮亮视野迅速明确更重要的一件事是及时切入到行业生态里——

打造基于「第一视角」的智能交互平台,提供远程指导系统、构建更高效的软件开发环境。

「这个行业在早期一定要有一套自己的完整解决方案,客户的问题对应的是解决方案而不是硬件产品。

花了三年时间,在软件上我们给不同的客户提供不同的远程指导系统、移动安防系统,整个这套都做完之后,我们才真正有了 Alpha 客户,我们慢慢发现这里有非常刚性的需求,然后开始投入量产,到今天形成了规模商业化。」

从第一单 4 台设备到几十台再到批量上千台,熬到了很多客户已经开始形成自己的软件开发团队,产品还没到手就已经进入开发软件环节。「这时候,我们很有信心量产化,形成软件、SDK 体系化打法往下走。」

在这样的体系中,很多客户一个月 30 天、一天 8 小时在使用眼镜,合作伙伴可以把他们的工程师从10个减少到1个,而且无需理解微软 Hololens 那一整套操作,只要知道安卓怎么投屏上去就可以解决问题。

当这些客户真正开始长时间使用眼镜,吴斐才真正感受到 AR 眼镜这个产品摸索出来了。

2017 年的第四季度,公司完成了第一次量产。

「当时深圳工厂量产出了第一批产品,而且客户要的非常急,我们还记错了到货时间和发货时间,结果客户就直接到工厂把几百台产品全部提走了。」吴斐笑着回忆道,之后类似的订单就越来越多了。

当然,对于AR眼镜这种前沿科技产品来说,切入行业应用的过程中都难免遇到问题,需要与客户不断展开深入的改进与磨合。

吴斐举了一个与华为合作的例子,去年在刚开始为华为eViewe智能服务装备提供前端的智能眼镜及核心技术的时候并不顺利。当时华为希望迪拜机房的工程师在佩戴眼镜时,位于深圳的专家可以实现远程指导。而第一次试用的效果却并不理想,机房声音嘈杂、对焦不清晰、后台需要支持成千上万的工程师……这些都是问题。

为了解决这个问题,双方一起构建了一套基于全球架构的流媒体服务。在此基础上,亮亮视野提供远程指导功能,知识库的实时积累以及一键呼叫+智能预约等服务。

「我们可以花费一、两年的时间去不断迭代,这个算法不行就重新来,这个眼镜不行就重新做,就是一直要做到成功。」吴斐说道。

尽管从目前的市场销量来看,AR眼镜的未来之路尚未明朗,但仍有不少公司前赴后继而来。前有谷歌、微软继续加码、苹果在此蓄力,后有小型创业公司试图啃食细分市场,甚至Rokid 这样的 AI 创业公司也在最近发布了自家的AR眼镜,想要分一杯羹。

「我们这个领域到今天也没有产品是一模一样的,甚至可以说千奇百怪,因为没有一个公式可以解决所有问题,也说明这个行业正处于早期。

另一方面,基本每个产业领域都有交互需求,每家公司专注的应用很难重叠,所以很长一段时间里,大家是碰不到的。」

今年 6 月,亮亮视野完成了亿元人民币 B+ 轮融资,由建银国际领投、蓝驰创投、经纬中国跟投,也成为国内首家完成 B+ 轮融资的 AR 公司。

吴斐告诉机器之能,目前公司有 100 人左右,新一笔融资的资金会用于扩大团队规模、扩展商业场景和扩大市场覆盖。

「AR 眼镜是一个非常复杂的交叉学科,不仅考验技术上的能力,还对产品的结构设计、供应链、渠道等方方面面有较高要求。所以你要从头走到尾,把整个链条都打通,这些都打通的一天才是客户买眼镜的第一天。这个行业在这个阶段真正的挑战是这个,而不是生产一副AR 眼镜本身。」吴斐总结道。

产业增强现实
暂无评论
暂无评论~