Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

让苹果副总裁都赞叹不已的中国AI创业公司,是如何在半年内实现规模化盈利的?| 人物对话



很多人的手机上可能都有「英语流利说」这个 App,当年一上线,就被苹果 App Store 多个区域推荐,且被评为年度精选,苹果副总裁还带队参观该公司。
「用一句话概括,英语流利说就是手机里的人工智能英语老师,不需要知道它是如何工作的,但它能比真人老师更高效地帮你学好英语。」英语流利说创始人、CEO 王翌说。
英语流利说上线于 2012 年,如今已有 7000 万的用户数量,覆盖 175 个国家。
2012 年之前,那时中国还没有人工智能概念,也没有互联网教育概念。谷歌产品经理王翌单纯觉得国内市场有很大机会,按照他的话说,有很多行业的「水位」,也就是效率比较低,可以去改进。
然而那时的王翌并没想好自己要做什么,回国之后的他加入一家做互联网广告创业公司,借此观察国内用户的需求。
有意思的是,他发现在不同的场合,包括在公司和同事聊天,他们都会问王翌「如何学英语」,「为何交了很多钱却没坚持下来」,「是不是应该多看点美剧。」
嗅觉敏锐的王翌发现这其中有很大需求,在调研中发现,像一些线下英语培训机构,正如同事的苦恼,很多人付了学费,但无法争取全程学完,效果也不明显。
正是那时,唱吧火了。「当时我觉得怎么会有人愿意对手机唱歌,后来发现内置的麦克风是一个 game changer,它可以改变一些用户的行为。我就想,这样子是不是大家也可以对着手机练英文,这么一个朴素的想法。」王翌说。
「我要找一个巨大的市场,用户有很好的付费习惯,效率还很低,可以改进。教育绝对算一个,剩下的还有金融和健康。」当时的王翌,决定选择教育,因为相对来说,金融和健康政策风险更高,但教育有很大一部分是课外培训。
「这方面完全可以靠产品竞争,用户可以拿手指头投票。」教育,再加上学英语的用户需求,王翌拉上同在谷歌工作,从事语音识别和机器学习的本科同学林晖,决定从英语学习做起,英语流利说由此诞生。
作为将人工智能应用于教育的典型公司,英语流利说也在我们的年终对话之列。

以下是王翌的专访实录(机器之能做了不改变内容的编辑):

英语流利说作为一款使用人工智能教学的产品,有哪些地方应用了人工智能?

在多年不断迭代的过程中,我们收集了世界上最大的中国人说英语的语音数据,通过这些数据,打造了精确度全行业第一的中国人说英语的识别引擎,在这个基础上,研发了评测引擎,给用户打分和反馈。最初,我们用语音识别技术给用户输入的口语打分,现在我们的引擎能够进行全方位的口语评测,甚至我们还研发了作文批改引擎。
我们有款跟雅思有关的功能,雅思考察「发音、语法、词汇、流利度」这四个维度,针对这四个维度,我们不仅可以精准打分,而且还通过了图灵测试,能以假乱真,AI 和真人考官之间的打分误差,小于两个真人考官之间打分的差距。在打分之后,从四个维度进行分析,给用户提供具体的改进措施。
2016 年 7 月,我们推出了世界上第一个 AI 英语老师,这是付费的系统解决方案,可以极大地帮助用户提高英文水平。
首先,用户先进行一个可变长度的自适应的定级测试,目前,已经有一千多万用户完成这个测试。所谓可变长度,也就是说,如果一个水平较低的同学,可能只花费五六分钟,系统就能确定他处于一级水平,如果水平高可能需要花费 20 分钟。
测试完成后,系统会确定用户的级别,也就是起点。比如是三级,那就从三级开始学。之后,是全沉浸式的学习体验,没有字幕没有翻译,用插画和动画的方式,把场景展现在面前,用户通过自己的尝试,来理解这些内容。之后,系统再让用户做练习,再进行强化,再将进度向前推,以此环环相扣。这套方法可以高效地帮助用户提升英文水平。通过 ETS 托福的测试,证明我们的 AI 老师可以三倍提升学习效率,比如要达到欧标的级别,原本需要 100 小时,但我们现在大概只要 36 小时。
不管是产品还是服务,能公布这种学习效率数据的英语学习机构,我们是世界上唯一一家。这是让我比较兴奋的。
最初从哪里获取的语音识别的数据?
冷启动的时候,也就是在产品发布之前,我们找了一些美国的 native speaker,给我们录了一些英文,来冷启动我们的引擎。此外,我们也用一些众包的方式在中国收集了一些中国用户的语音。当然,这个数量还是有限的。当我们的产品发布之后,获得的数据量级就不一样了,每天会有很多用户给我们贡献数据。这些数据非常多样化,人的水平不同,口音不同,用的设备不同,都是非常真实的环境下的数据。因为这些数据是用户跟读时输入的,还相当于打了标签的数据。由于大量用户的练习,我们相当于免费拿到了这些数据。
评测引擎所使用的标准语音数据从哪里获得?
我们邀请了很多专家对我们的数据进行标注,然后拿这些标准去训练我们的引擎。比如,我们雅思功能的引擎,就专门找的雅思考官。
英语流利说中那些个性化的内容从何而来?比如那些动画片、短片、场景。
我们的内容主要分两类,一类是免费的内容,一部分是找专业的 writers,撰写的原汁原味的英文的对话,还有我们社区里的用户贡献的 UGC、PGC 内容。我们有中国现在最活跃的语言学习社区,这些视频短片,很多是这个社区的贡献。
还有一类是我们的付费内容,是我们教研团队精心制作的,我们邀请了世界上先驱式的利用技术来做语言教学的专家做我们的顾问,比如 Phillip Lance Knowles 先生提出了层级递归认知理论(RHR 理论 Recursive Hierarchical Recognition Theory)和以脑认知神经科学(Cognitive Neuroscience)为基础的突破性的语言学习理论。我们的课程就是围绕 Lance 先生的学习理论来打造的内容,就像打造一个系统工程一样,有一套方法和思路。但我们打造的内容,跟写书不一样,写书是所有学生的学习顺序都一样,但我们是由一个引擎驱动,每个用户的内容顺序都不相同。
有没有想过用 AI 来创造内容?
这是一个大方向,其实我们也在做一些早期的尝试。
在做英语流利说的过程当中,你觉得是哪一点是最重要的?是用人工智能这些技术,还是这么多丰富的内容,或者是抓住用户的兴趣?

我觉得你说的都挺重要。我们和绝大多数你们采访的 AI 公司都不一样。首先 90% 以上的 AI 公司是 to B 的公司,to B 的公司是典型的,先有个榔头就是 AI 技术,然后找一个应用场景钉子锤进去,to B 的商业模式也比较清晰。但作为 to C 的公司,我们是从用户需求出发,没有先去找榔头,而是先找钉子,然后思考这个钉子是应该拔出来,还是把榔头敲进去。
第二,很多 to B 的公司,是单点突破,就是把人脸识别做到最强,可能就有人买单,但我们是 to C 公司,要做端到端,要自己先把流量做起来。我们最初用工具化的方式做流量,然后发现纯互联网模式比较轻,无法真正帮用户提升,所以又打造教研团队。做了之后,我发现人工智能上去了,教研上去了,但我们还要商业化,那我们又做了商业化的运营团队。
从 2016 年 7 月,我们开始商业化,到 2017 年 2 月实现了规模化盈利,这个速度是很快的。很多 AI 公司都在烧钱,对不对?现在 AI 相关的公司有很多人是有团队,简历很漂亮,但没技术,或者是有技术没产品,有产品没利润,我们是真的有团队、技术、产品,而且有盈利。就这几方面,如果都放在市场上去,我相信这样的公司是不多的。而且英语流利说是在全世界范围第一个实现规模化盈利的产品型公司,靠产品而不是公司。

现在有很多公司在做翻译耳机,之前谷歌的硬件发布会就发布了一款翻译耳机,对这样的产品,你怎么看?随着 AI 在翻译方面的进展,以后是否可以不用学英语?

像这样的翻译耳机,假设它性能不错的话,一定会满足一部分人的需求。比如中老年人出国玩,它是一个更加方便的翻译机,但是我认为它一定不可能取代语言学习这个市场。第一,教育部不可能因为有翻译机,就把英语课取消。第二,语言学习,其实不仅仅是翻译,翻译只是其中一个场景。语言学习是为了真的无障碍的交流,甚至语言学习里还有很多跟文化有关的需要理解的内容。只有这种天然的交流方式,才是用户想要的。而在学习语言的过程中,也有用户建立信心不断挑战自我,达成目标的这种成就感。另外,语言学习其实也有社交功能,很多人去培训机构,是去交友的,对吧?我们社区就有成为男女朋友,甚至结婚的例子。所以语言学习是一个综合的事情,并不是单方的对方没听懂,翻译给他就可以了。
今天我们想到的不是挑战学习,而是如何达到学习的终极状态,也就是个性化+高效率,要达到这两个目标,我们认为靠数据驱动的人工智能相关产品就是终极的解决方案。

你觉得目前英语流利说有哪些需要改进的地方?

我们认为在人工智能老师的尝试上面,我们只迈出了第一步,老师现在还不够智能,学习体验还有很多需要优化的地方。这是我们正在着力解决的问题。
其实人对自己的意识,自己的大脑如何工作了解得非常有限,这就是为什么我们现在跟很多神经认知学专家、教育学专家,比如斯坦福大学的教育学院院长,耶鲁大学神经学教授等专家合作的原因。我们跟这些专家合作,就是希望跨界推进一些最新的研究成果。我们的平台也有利于他们的研究,因为我们有大量的用户数据,能够迭代出新的学习模式。我们在美国湾区组建了一个教育+AI 的实验室,在全球范围之内吸引最优秀的人工智能专家、教育专家,脑认知神经学方面的专家加入,一起想象未来,创造未来。我们的目标是打造最智能最高效的人工智能英语老师。
从 2012 年到现在,英语流利说有哪些转折的地方?
2012 年,移动互联网大爆发,成为新的生活方式,几乎可以结合生活的任何方面,所以我觉得这里面机会巨大。但当时意识到,如果做得很轻,比如天气、日历、拍照,变现会有很大挑战。因此,我们就想着将移动互联网与传统行业进行结合。市场要大,付费习惯要刚性,效率要低,可以用技术+移动产品的方式去显著提升效率,调研了金融、健康和教育,切入教育。然后,我们决定单点突破,做一个极致好用的产品。英语流利说上线第一周就被苹果在中国大陆、香港、台湾和日本几个地区进行推荐,而且还成为苹果的年度精选,苹果的全球资深市场副总裁来我们公司来参观。这说明我们在产品上的投入,最后是得到回报的。
第二个转折是我们将英语流利说工具型产品变成社区型产品,推出了一个社区,用来提高用户粘性和活跃度,打造学习氛围。
第三件事是在 2014 年上半年,我们做了一个战略性质的决定,从零开始在完全不了解的情况下打造一支教研团队,从内容的角度,把涉及专业性的教育做好。因为之前就是纯互联网的,现在回头看这是非常正确的决定,只有在这方面做重,触及到教育的本质,也就是内容的个性化。如果你永远绕着它走,你永远就是个边缘型的公司。但今天我们是真的做到了,做到了给用户解决方案和结果的公司。
这个过程中,是否走过哪些弯路?
走过几个弯路。2014 年,我们觉得可能游戏化会进一步激发用户学英语的热情,于是和国外的内容方合作,尝试做两个小的学习游戏,用单词游戏的方式练口语。但这两个游戏并不成功,因为论游戏性,它没有普通游戏好玩,论学习,它的学习属性又没有那么强。2014 年下半年,我们想做系统教材的产品,当时第一反应是找顶尖出版社,培生、剑桥、牛津等,让他们将最好的教材授权给我们。但了解之后才发现,这些教材并不适合我们。因为这些教材的作者在写作的时候,脑子里想的都是线下教室的场景,并非一个用户坐在沙发上或躺在床上,拿着有麦克风的触屏手机这样一种学习场景。此后我们开始打造自己的教研团队,研发 AI 老师,投入了两年时间,对我们来说,这是战略上的变化,但目前看来是正确的。
你觉得英语学习的趋势是什么?
我们为什么在这个时间点做这个事情?其实我们看到了三个巨大的历史性机遇。
第一,整个学习正在从模拟走向数字,以前我们学习做作业写到纸上,老师在教室里挥挥手,这全是模拟的,没有被数字化。今天我们用户的学习过程,全轨迹百分之一百的行动,各种交互,全部数字化,这是一个巨大的跨越,只有这样,AI 化才有可能,你没有数字化,没有数据化,没有结构数据化,AI 是无从谈起,对吧?
第二,在教育行业,太长时间以来,学习体验是围绕老师进行,老师是学习的中心。这是在工业时代,学生多老师少,但我认为我们正在经历一个历史性的跨越,从以老师为中心到学生为中心。在英语培训界,很多人在做外教一对一,我们认为这是一个中间过渡状态。因为所谓的一对一并不是真正以学生为中心,整个课堂的进程还是老师在主导。而这些一对一的老师,并不能真正快速了解学生的需求,做出适合他的教学方案和教学行为。
但是,英语流利说的 AI 老师,不是人,所以它的判断完全依赖于学生的输入以及学生跟它的互动,通过深度学习等相关技术,它能够从巨大的内容库中找出相关内容,根据学生的水平,个性化地推送,而不是一次性把内容全都下载下来。我认为这是终极意义上的以学生为中心,根据学生的学习需求,强项弱点,安排学习的内容、复习的节奏和练习的频率等等。
第三,从商业模式上说,我们认为要从以过程为导向的商业模式发展到以结果为导向的商业模式,过程为导向,买的是老师的时间。比如培训机构,你学一百小时,如果没有进步,但培训机构不会负责,因为他的服务已经完成,已经把老师的时间卖给了你。所以,培训机构成为了老师时间的批发商,我们认为这种情况终将会过去,以后会变成按照结果付费。
我们的付费产品,就不是按照课时,而是为用户提供自助餐,一个月 99 元,用户可以成天泡在这上面。这是我们朝着最终按照结果付费的一个重要步骤。这种模式,如果是一个勤奋的学生,可以学很多,进步很快。我们的付费用户,平均一周学习时间在五小时以上。成年人现在有谁每周花五小时去学一样东西?这说明这对他们真的是有用的,而且他们也适应了在手机上跟着虚拟的 AI 老师学习。
你对英语流利说的短期规划和长期规划是什么?
我希望 2-3 年的时间,流利说能够建立起一支世界领先的将人工智能应用于教育的科研+教育产品团队,希望我们有世界领先的全栈的技术实力和产品实力。如果说长期规划的话,我希望在下一个十年,我们能成为世界领先的教育科技集团。



产业英语流利说王翌
1
暂无评论
暂无评论~