好未来 CTO 黄琰:AI 是优质教育资源的供给端。
不知从何时起,AI 技术与教育领域的跨界融合开始成为新风潮,许多教育机构也把 AI 当作自己的重要卖点。
整体看来,AI+教育仍处于发展的早期升温阶段。
好未来在去年开始正式对外亮出 AI 这张牌,并用「全力布局」来形容自己投入 AI 研发的决心。
同年 8 月,好未来成立 AI Lab 并发布「魔镜系列」产品。而在经过了一年的技术研发与产品打磨之后,好未来推出了全新的「WISROOM」智慧课堂解决方案,并升级「魔镜」智能测评系统。
「现在,AI 人才遍布我们的每一个事业部、项目组。」黄琰介绍道。
Q:眼下许多教育机构都为自己打上了 AI 加持的标签,在你看来,AI 在教育领域的落实情况究竟如何?
A:现在回头看,AI 在教育领域的落实进程可以归纳为三个阶段,分别为数字化、结构化、智能化。
数字化容易理解,就是把传统的纸质内容转化成电子版本,是后续 AI 技术在教育行业落地的重要基础。在此基础上,如何更好地利用这些数据就是结构化过程。而使用当下的 AI 技术从图像、语音等入口为产品赋予效果与价值则是所谓的智能化。
我们可以看到,2013 年是中国互联网教育元年,有一些公司提出了「互联网教育」的概念。当时 AI 还未兴起,但有许多公司参与其中,都开始做 AI,不论是传统的教育从业者,还是从互联网公司出来的创业者,亦或是投资人,均是如此。
2013 年底到 2014 年初,不少互联网教育创业公司诞生。那时与 AI 最接近的产品是类似于拍照搜题的 APP,相当于学习过程阶段的学习工具,这种工具符合技术主导、尤其是技术出身的教育创业者。那时大家依然是从教育创业方面讲互联网教育,大部分是把教育内容数字化。
AI 真正受到关注源于 2016 年 AlphaGo 战胜人类围棋手事件。那时的 AI 新技术主要指像图形、图象以及表情的识别、自然语言处理等,是教育的一个新切入点。在这之后,AI 知识开始普及,人们也开始思考 AI 的本质以及与企业深度合作的可能性。
在 AI 最开始出现时,拍照搜题是我认为 AI 在教育领域的一个非常好的应用。这波技术始于以名片识别厂商为代表的一批公司,这些公司最开始做中文的印刷体识别,包括给名片拍照将其直接转化成文字的形式。不过,那时纯粹的 AI 公司、互联网公司中的 AI 团队都还没出现,所以 AI 在教育领域还大部分停留在概念阶段。
而从 2017 年初到 2017 年中,AI 在教育领域才逐步进入蓬勃发展期。这个时期大量涌现了真正和 AI 技术相关的教育产品,AI+教育也稳步迈向了繁荣期。
这就要提到自适应学习,事实上,有许多公司在去年发布了自适应学习系统。自适应学习有很多变种,是一个范围很大的概念。伴随而来的是高考机器人,这类机器人可以解题、判题以及自动阅卷。在中国的英语考试中,不管是托福、GRE,还是中考、高考,其中的英语口语阅卷都可以用计算机完成,这些产品的出现标志着 AI 在教育里面的真正落地。
Q:好未来在 AI 这条路上的探索经历?
A:我们是在 2016 年的时候开始了 AI 方面的尝试,开始积极把自适应学习技术运用到好未来的教育体系里,探索拍照搜题、自然索引等功能。那时我们也开始投资全球的自适应学习公司,例如 Knewton。
其实在 2016 年,我们最开始考虑的是商业智能,希望可以让我们的数据产生有价值的产品,进而对学生有所帮助,并为此成立了一个大数据部门,执行的也就是之前所提到的结构化过程。
在 2017 年下半年,我们开始在多个维度全面探索 AI。我们也在思考,究竟 AI 在哪些业务领域可以产生实际的价值?
当时我们自己也没有一个确定的答案,所以我们一边同行业进行广泛交流,一边寻找行业内的刚需和痛点并快速打磨产品,初步形成了 AI 雏形。
在 2017 年 8 月,我们正式宣布成立 AI Lab 并推出「魔镜系列」产品,上个月我们发布了第二代产品:「WISROOM」智慧课堂解决方案。
Q:在 AI Lab 成立至今的一年多时间里,对技术与产品的研发进展与成果?
A:AI Lab 对外有两个产品,分别为「魔镜」和「WISROOM」。
「魔镜」是一个系列产品,主要应用于好未来的业务,其核心价值是解决「双师课堂」的痛点和刚需。
「双师课堂」是我们第一次解构「学习」一词里面的「学」和「习」二字。通常意义上我们认为,「学」是接受新知识,「习」是复习、温习、预习。所谓「双师」其实是把学习的过程拆解成两个步骤,每个步骤由专门的老师负责。
第一个老师负责孩子「学」的过程,与孩子进行互动、传递新知识;第二个老师叫辅导老师,在孩子的学习过程中进行更细密度的交互、沟通,包括鼓励、表扬,带着孩子去解决问题,负责课后答疑,覆盖知识盲点等。
「双师」的主讲老师会同时存在于很多个教室,而每个学生其实都需要知道老师给他的反馈,无论是点名、表扬、互动、点评,对孩子而言都非常有价值。
这里涉及到一个脑研究的核心学术认知,一个四年级以下的孩子,他喜好或是厌恶一门学科是与老师对他的注意力分配呈正相关。
「魔镜」就给予了老师们一副千里眼、一对顺风耳和一个超能记忆力,帮助老师不仅能看到孩子在课堂上的表现,还能记忆历史表现。当然,「魔镜」也可以让老师看到班上每一位同学上课的专注度。
随着时间的变化,这个数据从数字化到结构化,可以拟合成非常多有价值的信息。比如说老师可以评判出一个孩子最近三个月和最近一个月是否出现了显著差异。
我们在「魔镜」基础上升级 AI 助手,系统能听、能看、能评价学生与老师,这有利于我们做出更细致的判断,从而知道这些课程好不好,是否需要调整难易程度,这就是智慧教室「WISROOM」。
在过去,一节课对于这个班级是不是太难了或太简单了,我们并不知道。上完课后,孩子说听不懂,老师下次才会调整。而未来的智慧教室会先导入孩子的画像,自动计算和生成这节课应该用什么难度、什么节奏、什么教学框架去给孩子们上课,这就是我们所定义的智慧教室。
换言之,也就是整个学习过程是因材施教的,而这些都是基于底层技术的应用,比如声音处理、语音识别、语音合成、面部表情计算、情感计算等。
Q:目前 AI Lab 团队的人数及方向划分?好未来在 AI 人才上的布局?
A:我们现在有 4000 名研发人员,其中 AI Lab 团队大约有 200 人左右,其余每个事业部、项目组都有 AI 方面的人才,进行数据挖掘、数据分析、商业智能、行情分析等。
好未来的 AI Lab 更像是 AI 产品研发部,需要占领行业制高点。我们有专利,陆续会有自然科学基金,也有国家项目重点支持。
我们希望有研有发,避免研而不发,或者多研少发。所以我们很多路径跟其他的 AI Lab 可能不一样,我们的愿景是最后能通过 AI 产品走进用户和商业体系,让大家感受到 AI 转化为产品以后真正发挥的意义和价值。
Q:所以我们的技术研发是以产品需求为导向的对吗?是否可以通过一个具体的落地案例,讲述团队从到最初的需求确认到技术研发、迭代优化至最终产品上线的全过程?
A:是的。
我们要对需求有足够深刻和细致的把握,这是我们的立身之本。比如一个教室里开灯或不开灯、太阳在东边还是在西边造成光影的变化,这些都细节都会对算法造成影响。
我们有一个项目想做一件事情,就是对老师上课质量的好坏进行评价。之前好未来有非常好的评价机制,根据这个老师的学生对他的喜好程度进行评价,但是评价周期是以学期为基准。
我们有一个团队,专门评价老师教学质量好坏。我们问最有经验的专家怎么评价这些老师?他说我只要两分钟,看两件事。第一件事是听老师讲课的感觉,二是看老师的板书。
为了做这样一套可以评估每个老师上课质量的系统,我们找到清华大学语音情感方面的专家。要知道,老师有那么多重要的表情需要给予关注,我们应该怎样做这样一套评估系统呢?
解决这个问题的核心是要有科学解决问题的方法论。比如 AI 中有非常经典的解决方法叫做标签、标注,就是一个老师讲得好不好,如果一百个人都说好,只有一个人说不好,那么我们就听一百个人的观点,这是第一类。第二类是,如果家长都说好,其他人说不好,听家长的。第三类是,如果专家说好,小白说不好,那么听专家的。这三个维度一叠加,我们基本上就能确定一个正确的方式。最后我们发现有两个维度最重要,这是我们的 AI 团队拟合出来的,第一个叫做愉悦程度,第二个叫做情感饱和度。
通过这样的判断,我们可以知道,好未来原来有那么多幽默的老师、哪些科目的老师被学生爱戴,这都是可以数据化的,是从数据化通往智能化的一个必经过程。我们目前已经在 15 间教室对这套系统进行了部署,希望未来语音可以解决 85% 以上的问题。
当然,我们不能简单地说哪项数据好,哪个老师就一定好,但是可以据此对老师进行分类。中国历史上有一个看上去准确但实际上不准确的描述,叫做「教无定法」,就是说好的老师有不同的教法。在我看来,「教无定法」只是因为没有强大的机制将其分类。
另一方面,每个老师看到这套系统的结果也会觉得非常有价值,他能知道自己是不是幽默型的,然后再仔细看自己的幽默指数有多少,系统也会告诉他在哪个地方可以做得更好。
Q:对于教育行业来说,学习效果才是企业竞争力的最终评判要素。很多情况下,用户可能无法直接从眼前的产品使用端感受到 AI 能力的存在。那么在你眼中,如何评判一项 AI 技术对于一教育产品的意义和价值?
A:我认为有两件事情很重要。第一件事情叫做价值的外显性,第二件事情叫做理论和学术的支撑。外显性让人产生直觉的信心,理论和学术的支撑是让它产生底层的信心。
把 AI 技术引入教育产品所带来的变化主要体现在三个方面,一是提高系统的运营效率,二是提升学生的学习体验和学习兴趣,三是生成独立的、全新的产品形态。
对于教育而言,AI 更像是一个杠杆和一个支点,可以从方方面面渗透其中并撬动许多业务,让其焕发出更多的生机和活力。
Q:有人把教育比作一个黑盒,如果教学过程没有被数据化,那么教学质量也无法被量化。在各行各业都在发生数据革命的时候,教育行业也是如此。如何最大程度地挖掘教育数据的价值?如何实现数据共享至关重要。好未来在数据上的思考?
A:在教育行业,数据是非常重要的,数据量每年正以十倍的速度增长,未来五年还会继续保持这一态势。
而教育数据的挖掘其实还处在一个非常早期的阶段,每个企业、每个团队都在探索,小到上课时观察微笑次数形成报告发送给家长,大到掌握学生在哪个知识点上没学好。
自适应学习是典型的数据探索。以错题本为例,如果错了一百道题,考试前学生就会去看这一百道题。那么这一百道题有没有共性,能不能结构化缩减,就是一个很大的突破。未来的数据挖掘会越来越成熟的。
数据共享是一个极有价值但实践难度却很大的事情。数据是一个既涉及用户隐私本身又具备巨大商业价值的事情,大家不知道这个保护层如何使用,所以未来行业中可能会有更多的一些契机和技术,包括区块链等技术,促进数据向更加开放和共享的方向前进。目前,我们还只是一个保存者,把它安安全全的保存在这里,并没有充分的发挥出它的价值,还停留在初级阶段。
Q:AI+教育行业仍处于早期发展的升温阶段,粗略统计,目前至少已经有 40 家公司已宣布入场,你如何看待领域发展的现状?
A:不仅是有很多公司宣布入场,其实资本层面也在大规模进入。整体而言,行业内难免出现有产业泡沫、概念模糊的情况。
但从积极的方面看,在新技术进入教育领域的过程当中,聚光灯也随着而来。这意味着,一是会有更多的人才愿意进来,二是更多资本将加大尝试频率、产业可能性也将变得更多。
以人才为例,此前行业内可能大部分都是教育学家,未来则有更多的顶级数学家、统计学家、AI 科学家、甚至是脑科学、基因科学家跨行进入教育领域。AI 这波浪潮过来以后,很多工程师也可能会把进入教育行业作为工作的首选,我认为这具有较大的社会意义。
Q:行业内的真实竞争情况如何?好未来的亮点及护城河是什么?
A:即便众多公司宣布入场做 AI 教育,但大家几乎都在各自不同的领域进行着探索。这个市场很大,大家并不是在一个小小的领域里碰撞、摩擦,而是根据自身优势挖掘问题、解决问题。在这里,好未来有自己的独特之处。
相较于课前预习与课后作业,课中的老师讲课与学生听课其实才是学习最重要的环节。我们认为在「教和学」的主场景里,目前其实缺乏 AI 应用。
在不改变老师的授课习惯和学生学习习惯的前提下,让教室里的学生拥有更好的学习体验、让老师被更好地赋能,是好未来的特色。
而这个特色是基于我们 18000 多名一线老师每天讲课所收集上来的真实问题,这些问题会被提供给 AI 产品经理以及教育专家,抽象成待技术解决的问题,再看当前的技术能否解决。如果没有这个前置能力,是很难切入课中环节的。
好未来的亮点在于对于真实教育环节中出现的问题、痛点和刚需的把握。问题越真实,解决问题就越有力量;问题越不真实,一旦遭遇挫折团队就越容易往回撤。很多公司布局科技研发所碰到的最大瓶颈就在于此,因为它们看不到科技投入以后会给企业、团队所带来的价值。
Q:你曾说过,科技不是为了酷炫,而是要解决教育中面临的真正问题。那么你认为,眼下教育行业需要解决的真正问题究竟是什么?
A:教育本身有很多比较大的问题。从国家政策来讲,教育公平和优质教育资源的短缺是两大问题。
以前好未来投资建希望小学,后来我们发现了更好的方式来做这件事情,就是线上支教,精准扶贫。一方面通过直播技术让好的老师在线扶贫,另一方面把教育的质量提得更高,价格降得更低,甚至提供很多免费的课程。
中国不缺老师,但缺好老师,我们对 AI 的理解本质上是优质教育资源的供给端。要让一个好的老师在 AI 的辅助下覆盖更多的学生,让一个 60 分的老师在 AI 的赋能下达到 80 分到 85 分。
AI 在教育领域会成为一个非常重要的角色,因为所有的系统本身都是科技,包括我们已经研发的 ICS(智能教学系统,现已更名为 ITS)、IPS(智能练习系统,后升级更名为学而思「云学习」)、「魔镜」、「WISROOM」等。我们对未来 AI 在教育领域的最终设想是:AI 教书,老师育人。