Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

在这场科大讯飞「向开发者致敬」的大会上,你应该听听开发者自己的声音

撰文| 宇多田

「不酷炫、不年轻」。这是我们对科大讯飞创立 18 年以来第一次举办的这场开发者大会最为深刻的印象。

1/4 个足球场大的会议现场内几乎没有任何花哨的摆设:

几千把椅子,外加一个临时搭建的演讲台和三面屏幕墙。这里并没有你想在 Google 或者 Facebook 开发者大会上想找到的科技感。


现场挤满了人


而通常技术企业办大会必备的产品展台与第三方合作伙伴的展位,则全部被移到了室外,呈一字型排开,你可以沿着科大讯飞在旁边标注的序列号和产品类别,从这头瞧到那头。

从远处望去,大概又会容易勾起我们大学时代的回忆——当年开学后各类社团纳新摆摊,还有毕业时的义卖会都有类似的 style。



当然,这场大会另一个特色也很瞩目——有很大一部分在座的「开发者」并不年轻,对科技也不狂热,但却很会做硬件这门生意。

 

他们是来自广东、江苏等地的硬件工厂老板。正如科大讯飞执行总裁胡郁所说,科大讯飞的「开发者」可能更多集中在消费级产品领域,机器人行业 60% 的 CEO 和创始人们都到了现场。

 

当然,还有一部分受众也不能忽视,他们包括大学生、中小技术开发者、科大讯飞消费级产品的用户,以及期望能够从人工智能领域找到新机会的跨界从业人员。

 



而以上,恰恰都是科大讯飞开发者大会的特殊之处。

在机器人等智能硬件品类市场极大的语音解决方案占有率,决定了它的「开发者」有着与众不同的基因——并非传统意义上的 Developer,也并非单纯的程序员,而是语义范围更大的「产业链拓展者」。

 



实际上,科大讯飞这场名为「向开发者致敬」的大会主旨非常简单:「预约」人才(建立 AI 大学),孵化企业(成立 10.24 亿孵化基金,与各地孵化器合作),建立生态。

确切地说,任何开发者大会存在的本身,都是源于公司建立生态的最终诉求。


 而胡郁给「生态」的解释再一次建立在「范围经济」(长尾效应)之上。在接受多家媒体采访时,他再一次提到了这个观点,从而延伸出科大讯飞想要构建的生态产业链形态:

 

「我们的业务主要是从系统顶层设计的角度来考虑的。

其中有一些大的,我们自己做的这种就是源头核心技术相关的直接产品,形成一些主干产品体系,但在这些产品体系里面需要很多补充,特别是应用创新与微创新,它们更多是由创新创业者来完成,去满足长尾用户的需求。

 

我们跟开发者之间是一个相互补充的关系,从资金和研发能力方面,他们是很难去做这个系统化的。」

资金、资源、用户、开发者,外加一个产业链上的所有公司。这与当下所有一线技术大佬们的想法别无二致,科大讯飞想构建的,是一个以「语音技术」为基础和起点的「小社会」。



那么,这个总是被技术巨头们挂在嘴边的「生态」,对开发者来说意味着什么呢?

 

在中国 AI 技术人才缺口达到 100 万的当下,很多人都说,技术开发者们可能的确迎来了最好的时代。

包括 BAT 在内的所有技术巨头都推出了各种各样的 AI 开放平台,形成了以开发者为核心的「买方市场」——开发者可以在多个生态的交集中不断雕琢自己的产品。

也许正因为如此,我们在与现场许多开发者的交流中发现,他们虽然几乎都为「科大讯飞」这个品牌慕名而来,但对待其技术与产品的态度却是冷静,审慎,甚至是挑剔的。



在科大讯飞露天的十几个产品展位上,我们遇见了很多来自广东和江苏的硬件厂商。

这是一群「市场嗅觉」异常敏锐的企业家。不过,他们显然对于「开发者」这个词还不太适应,更喜欢自称为「给硬件和软件做集成的人」。其中,有部分厂商甚至表示正在「备战」2018 年的 CES 电子消费展。

一位来自深圳的硬件厂商技术人员告诉机器之能,自己来这里还是想主要看看科大讯飞有什么新东西出来可以对接,特别是语音这一块的技能。

不过,他虽然承认自己的产品使用了科大讯飞的部分语音技术,但却一直在强调「调用的只有两三个 API」。

「用的基本是语音输入这一块,也有用了别家的图像识别系统,也有一小部分是自己的技术。」

另一位来自苏州的硬件厂商也表示,自己产品使用科大讯飞技术的层次还不够深,同时考虑其他技术公司提供的方案。不过他也坦白,自己来也是想看看同行到底在做什么:

「科大讯飞的技术肯定厉害,但是我们用的也就语音这一小块,来这里也是想看看趋势是什么,大家都是怎么想的,交流一下。你看做硬件的这么多,也很多元化了,我们赚钱也很有压力,一直在找一些能增加差异化的东西。」

还有部分厂商更重视技术以外的其他方面——语音技术解决方案只是他们需要思考的一小部分,拓展销售渠道和一些能增加自身爆点的东西更重要:

「有时候科大讯飞强调自己可以提供一种‘品牌庇护’,但是市面上用他们方案的公司太多了,有时候强调反而起到反作用。做起我们自己的品牌和口碑其实很重要,所以我们营销方面的开销也会很大,参加一些展览和比赛其实非常必要。」



这些务实的硬件厂商们,基本聚集在所有的 2C 产品展位前,特别是在「晓译翻译机」和「智能机器人」的展位,通常会跟科大讯飞的工作人员聊上很久。

不过,他们似乎对看到和了解到的结果并不是很满意。一位来自成都的硬件开发者对着我们直摇头:

「来这里想看看趋势,看看有啥新商机,毕竟是科大讯飞嘛。但是你看那些集成了他们语音模块的机器人,都大同小异,说难听一些就是高级玩具,实用性太差。当然我们自己做的东西也没好到哪里,来这里就是想知道到底哪里值得学习。」



实际上,在十几个展台中,几乎有一大半展出的智能硬件都来自第三方硬件技术公司。

一家来自深圳的公司还热情地邀请我们试用他们集成了叮咚语音系统的智能按摩椅。「这次所有展台上的硬件产品,包括这个椅子,都是用了科大讯飞的语音硬件模组」,负责人指着椅子上方嵌入的一个话筒告诉我们。

他提到的语音硬件模组,特别是魔飞麦克风,就是这次科大讯飞主推的 2B 型「半成品」硬件。

通俗一点讲,就是你想做一个音箱,如果已经有了一个外壳,就可以直接把这个魔飞装进去,然后联网,在 AIUI 语音开放平台上完成配置。

我们在科大讯飞专门为成品级硬件模组开设的展台上,看到了从几百到上千不同价位不同功能的各种麦克阵列板和评估板,每种面板的介绍牌上都标着自己的特定功能。

与魔飞几乎同理,这些硬件模块都可以经过配置接入你的硬件,有点像「速学成才」。但工作人员告诉我们,每种模块的功能都是组合好的,各种功能板不能同时给一个硬件进行配置。



右上方的圆形硬件就是「魔飞」。这些模组都会按照硬件集成商购买的数量进行梯级降价。

但不是没有人怀疑这种「速成硬件」的实用性。

实际上,有不少在展台区走了一圈的开发者都向我们提出了一个质疑:除了外形稍有差异外,几乎所有机器人的功能都大同小异。

一位来自北京的教育软件开发者直言不讳地道出了自己的看法——「把机器人还是想的太简单」。他认为,作为开发者,所有人都应该谨慎对待这种「一键速成」的理念。

「特别是展台上的那些教育机器人,有大有小,但是对话方式,给你的回复都千篇一律,基本是逗孩子玩的。对于硬件开发者来说,这只能是一种赚快钱的方式。而且除了内容输出的流畅性,教育机器人另外一个关键点,是在于海量丰富的内容。我看了一下,内容其实并不是特别多。」他提出了自己的看法。

而另一位做大数据相关工作的开发者认为,智能机器人不智能,从目前来看倒是一种常态。因为「智能」不单单跟语音交互技术有关:

「我其实不想拿波士顿动力狗举例子的,但是他们的运动系统实在太棒了。我没有说科大讯飞的语音交互做的不好,实际上非常好,但是它只应该是机器人的一部分,是否有大脑,以及控制中枢与机器人各个零部件的连接也非常关键。

我还是有点失望的,你看那些机器人只会扭头动手臂,重复一些预置对话。对于一个好的机器人来说,其实远远不止语音这么简单。」



实际上,胡郁在当天接受媒体采访时,曾就「科大讯飞究竟不做什么」这个问题做了一个综述。但我们记住了一点:

「从消费级层面来说,图像方面是不做的,只有语音是我们的核心。图像只会是深入到某一个垂直场景去做,譬如医疗领域。

我们现在主要的技术还是集中在打通人和机器的入口,主要靠语音和语言的创新,并不是要把图像做成我们最主要的开放的这个平台。」

换句话说,语音平台是开放的,但图像方面可能是不开放的,也不会有图像产品。

因此,这在某种程度上给科大讯飞带来了更多合作伙伴,也给其基金的投资方向带来了更多可能性;但这也意味着,科大讯飞既需要把语音这一环做到极致才能持续吸引更多开发者,也同时需要考虑如何增强自己的「全栈竞争能力」,以抵挡潜在竞争伙伴的「攻势」。

一位成都 AI 芯片厂商的回答很有意思。他告诉我们,一方面自己很赞同科大讯飞营造生态的方向,但另一方面,也认为他们做的不够底层:

「讯飞这样做肯定是对的,这是我从一个同业者的角度来看这个事情。现在没有一家公司可以把什么方面都顾及到,他把自己的技术开放出来,做成一个平台,大家都来玩,这个方向是很对的。

但是,他们其实还不够底层,譬如有些产品采购的是别人的芯片,我们这次其实就是来谈合作的。我们有自己的芯片,自己的核心技术,自己的语音解决方案,按道理的话我们更应该做生态。」



而从中小开发者角度来看,大多数或处于观望状态,或正在多生态中不断穿梭,寻找着打造优质产品的更多软硬组合搭配方式。譬如,在现场有不少个人技术开发者向我们传递了这样一种意愿——所有平台他们都会试试看。

「我对那个 AIUI 平台很感兴趣,科大讯飞语音方面很强,我想先从语音方面入手,学习一下这方面的编程实现。至于图像识别方面,我对科大讯飞了解不是很多,但知道其他一些公司在做这些事情。」一位目前仍在电商行业,但希望能在人工智能领域寻找新机会的技术开发者表达了这样的期望。

而另一位正在学习AI相关课程的跨界技术开发者告诉我们,调用多个平台的 API 去做自己的东西对于他们来说完全没有问题:

「只需要我们对数据做一些预处理,使其符合格式,就能没有影响地调用多个 API。当然,前提是平台开放,而且每调用一个 API 都会有延迟,此外我们需要学习各个 API 的调用方法与参数。」



当然,混杂着赞扬与质疑的声音并非只来自于开发者。既然科大讯飞有自己更为直观的消费级产品,用户和潜在底层竞争者们更加犀利的反馈通常是不可避免的。

一位将近 80 岁的科大教授在晓译翻译机和「讯飞听见」展区徘徊了很久,显然不满意它给出的翻译结果:「你看,我说『就要走了』,它翻译成『just go』,这能行吗?」

但是当我们问他:「你觉得这些产品都做得怎么样时」,他似乎又欲言又止:

「你相信我年轻时也做过人工智能吗?那个时候国内也集结了一批学术带头人做『医学诊疗系统』,特别是『远程中医专家系统』,说实话都失败了。这已经是人工智能潮起第三次了,我不能完全批评他们的产品做得不好,得多鼓励一下,其实能做到这样已经很不容易。」

「但是,」他话锋一转,「如果这不是一件产品,这是做产业,那就要小心了。把人的一些东西知识,让计算机来表达不是那么容易的事情。你看我刚才还建议科大讯飞给改个名字,叫什么『晓译翻译机』,确切地说应该叫『晓译翻译助手』,你说翻译机,搞得像它是个『翻译专家』一样。」


晓译翻译机展台

还有一位老工程师在阿尔法蛋机器人展台向工作人员反映了使用情况,说自己给孙子买的这个机器人很容易死机。

实际上,他倒没觉得智能有多重要,只是想让在深圳的孙子跟自己用这个设备多沟通:

「他经常玩这个机器人,但是有时候跟他通视频,这东西就会死机。科大讯飞应该再在细节上多下点功夫,语音做好了,其他细节也得过关。」

另外,他也抱怨了「唤醒词」的存在:「我之前也买了一台他们的智能台灯,你说唤醒词就够烦了,这个灯你还要『阿拉丁阿拉丁』地叫两次。」

不过这次在大会,他又一激动下单了一个晓译翻译机:「我之前跟老太婆出国去玩,用的 Google 翻译,中翻英还行,但是英翻中我看不懂啊。他们说这个还行,那这次我们去澳洲就试试这个。」

「看来您还挺喜欢科大讯飞的产品的,买了好几件。」我们这样问他,他两手一摊,开了个玩笑:

「谁让我家老太婆买了科大讯飞的股票,买点东西支持支持它!」

不过,现场另一位用过晓译翻译机的媒体人给了我们一个意味深长的体验感总结:

「值得鼓励。因为从 60% 到 95% 是不能用和能用的区别,但是从 95% 到 99% 却是能用和好用的区别。」



其实对于像科大讯飞这样的人工智能领袖级企业来说,市场的质疑、开发者的思虑以及消费者的吐槽,是其成长过程中一定会体验无数次的颇有价值的反馈。

但还有一种情况,可能也是在 AI 人才紧缺的当下,浮现出的更加现实的东西。

机器之能在现场,遇到了当地大学计算机学院的学生们。他们被老师集体组织来现场观摩学习「人工智能大拿与最先进的语音识别技术」。我们问了几个学生关于这次大会的感受,没想到却得到了他们颇为一致,但又跟意料中不太一样的答案:

A:你们是学什么的?

B:我们是学计算机的。

A:你来开发者大会感觉怎么样?

B:挺好的,人工智能很热,是一个重要方向。

A:你们正好是觉得计算机的,会在这方面做一些职业规划吗?

B:嗯……班里有人可能会这样想,但我不会。(附和)

A:那你想做什么?

B:公务员吧,更稳定一些。

A:正好学了计算机,会觉得可惜吗?

C:人工智能门槛比较高,对个人的能力要求也要更高一些,这一方面我们可能会差很多。

D:科大讯飞本身门槛很高,像我们这种可能也望尘莫及。

大概在采访胡郁时,我们听到那句「希望科大讯飞与开发者们一起砥砺前行」还略感茫然和无所谓;但是在走近开发者后,我们却真切感受到了任何一家人工智能公司成长与自我突破的不易。

入门科大讯飞产业开发者
暂无评论
暂无评论~