Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

一家教育巨头的另类AI解题思路

好未来 CTO 黄琰:AI 是优质教育资源的供给端。

不知从何时起,AI 技术与教育领域的跨界融合开始成为新风潮,许多教育机构也把 AI 当作自己的重要卖点。

整体看来,AI+教育仍处于发展的早期升温阶段。

好未来在去年开始正式对外亮出 AI 这张牌,并用「全力布局」来形容自己投入 AI 研发的决心。

同年 8 月,好未来成立 AI Lab 并发布「魔镜系列」产品。而在经过了一年的技术研发与产品打磨之后,好未来推出了全新的「WISROOM」智慧课堂解决方案,并升级「魔镜」智能测评系统。

「现在,AI 人才遍布我们的每一个事业部、项目组。」黄琰介绍道。

好未来 CTO 黄琰

Q:眼下许多教育机构都为自己打上了 AI 加持的标签,在你看来,AI 在教育领域的落实情况究竟如何?

A:现在回头看,AI 在教育领域的落实进程可以归纳为三个阶段,分别为数字化、结构化、智能化。

数字化容易理解,就是把传统的纸质内容转化成电子版本,是后续 AI 技术在教育行业落地的重要基础。在此基础上,如何更好地利用这些数据就是结构化过程。而使用当下的 AI 技术从图像、语音等入口为产品赋予效果与价值则是所谓的智能化。

我们可以看到,2013 年是中国互联网教育元年,有一些公司提出了「互联网教育」的概念。当时 AI 还未兴起,但有许多公司参与其中,都开始做 AI,不论是传统的教育从业者,还是从互联网公司出来的创业者,亦或是投资人,均是如此。

2013 年底到 2014 年初,不少互联网教育创业公司诞生。那时与 AI 最接近的产品是类似于拍照搜题的 APP,相当于学习过程阶段的学习工具,这种工具符合技术主导、尤其是技术出身的教育创业者。那时大家依然是从教育创业方面讲互联网教育,大部分是把教育内容数字化。

AI 真正受到关注源于 2016 年 AlphaGo 战胜人类围棋手事件。那时的 AI 新技术主要指像图形、图象以及表情的识别、自然语言处理等,是教育的一个新切入点。在这之后,AI 知识开始普及,人们也开始思考 AI 的本质以及与企业深度合作的可能性。

在 AI 最开始出现时,拍照搜题是我认为 AI 在教育领域的一个非常好的应用。这波技术始于以名片识别厂商为代表的一批公司,这些公司最开始做中文的印刷体识别,包括给名片拍照将其直接转化成文字的形式。不过,那时纯粹的 AI 公司、互联网公司中的 AI 团队都还没出现,所以 AI 在教育领域还大部分停留在概念阶段。

而从 2017 年初到 2017 年中,AI 在教育领域才逐步进入蓬勃发展期。这个时期大量涌现了真正和 AI 技术相关的教育产品,AI+教育也稳步迈向了繁荣期。

这就要提到自适应学习,事实上,有许多公司在去年发布了自适应学习系统。自适应学习有很多变种,是一个范围很大的概念。伴随而来的是高考机器人,这类机器人可以解题、判题以及自动阅卷。在中国的英语考试中,不管是托福、GRE,还是中考、高考,其中的英语口语阅卷都可以用计算机完成,这些产品的出现标志着 AI 在教育里面的真正落地。

Q:好未来在 AI 这条路上的探索经历?

A:我们是在 2016 年的时候开始了 AI 方面的尝试,开始积极把自适应学习技术运用到好未来的教育体系里,探索拍照搜题、自然索引等功能。那时我们也开始投资全球的自适应学习公司,例如 Knewton。

其实在 2016 年,我们最开始考虑的是商业智能,希望可以让我们的数据产生有价值的产品,进而对学生有所帮助,并为此成立了一个大数据部门,执行的也就是之前所提到的结构化过程。

在 2017 年下半年,我们开始在多个维度全面探索 AI。我们也在思考,究竟 AI 在哪些业务领域可以产生实际的价值?

当时我们自己也没有一个确定的答案,所以我们一边同行业进行广泛交流,一边寻找行业内的刚需和痛点并快速打磨产品,初步形成了 AI 雏形。

在 2017 年 8 月,我们正式宣布成立 AI Lab 并推出「魔镜系列」产品,上个月我们发布了第二代产品:「WISROOM」智慧课堂解决方案。

Q:在 AI Lab 成立至今的一年多时间里,对技术与产品的研发进展与成果?

A:AI Lab 对外有两个产品,分别为「魔镜」和「WISROOM」。

「魔镜」是一个系列产品,主要应用于好未来的业务,其核心价值是解决「双师课堂」的痛点和刚需。

「双师课堂」是我们第一次解构「学习」一词里面的「学」和「习」二字。通常意义上我们认为,「学」是接受新知识,「习」是复习、温习、预习。所谓「双师」其实是把学习的过程拆解成两个步骤,每个步骤由专门的老师负责。

第一个老师负责孩子「学」的过程,与孩子进行互动、传递新知识;第二个老师叫辅导老师,在孩子的学习过程中进行更细密度的交互、沟通,包括鼓励、表扬,带着孩子去解决问题,负责课后答疑,覆盖知识盲点等。

「双师」的主讲老师会同时存在于很多个教室,而每个学生其实都需要知道老师给他的反馈,无论是点名、表扬、互动、点评,对孩子而言都非常有价值。

这里涉及到一个脑研究的核心学术认知,一个四年级以下的孩子,他喜好或是厌恶一门学科是与老师对他的注意力分配呈正相关。

「魔镜」就给予了老师们一副千里眼、一对顺风耳和一个超能记忆力,帮助老师不仅能看到孩子在课堂上的表现,还能记忆历史表现。当然,「魔镜」也可以让老师看到班上每一位同学上课的专注度。

随着时间的变化,这个数据从数字化到结构化,可以拟合成非常多有价值的信息。比如说老师可以评判出一个孩子最近三个月和最近一个月是否出现了显著差异。

我们在「魔镜」基础上升级 AI 助手,系统能听、能看、能评价学生与老师,这有利于我们做出更细致的判断,从而知道这些课程好不好,是否需要调整难易程度,这就是智慧教室「WISROOM」。

在过去,一节课对于这个班级是不是太难了或太简单了,我们并不知道。上完课后,孩子说听不懂,老师下次才会调整。而未来的智慧教室会先导入孩子的画像,自动计算和生成这节课应该用什么难度、什么节奏、什么教学框架去给孩子们上课,这就是我们所定义的智慧教室。

换言之,也就是整个学习过程是因材施教的,而这些都是基于底层技术的应用,比如声音处理、语音识别语音合成、面部表情计算、情感计算等。

Q:目前 AI Lab 团队的人数及方向划分?好未来在 AI 人才上的布局?

A:我们现在有 4000 名研发人员,其中 AI Lab 团队大约有 200 人左右,其余每个事业部、项目组都有 AI 方面的人才,进行数据挖掘、数据分析、商业智能、行情分析等。

好未来的 AI Lab 更像是 AI 产品研发部,需要占领行业制高点。我们有专利,陆续会有自然科学基金,也有国家项目重点支持。

我们希望有研有发,避免研而不发,或者多研少发。所以我们很多路径跟其他的 AI Lab 可能不一样,我们的愿景是最后能通过 AI 产品走进用户和商业体系,让大家感受到 AI 转化为产品以后真正发挥的意义和价值。

Q:所以我们的技术研发是以产品需求为导向的对吗?是否可以通过一个具体的落地案例,讲述团队从到最初的需求确认到技术研发、迭代优化至最终产品上线的全过程?

A:是的。

我们要对需求有足够深刻和细致的把握,这是我们的立身之本。比如一个教室里开灯或不开灯、太阳在东边还是在西边造成光影的变化,这些都细节都会对算法造成影响。

我们有一个项目想做一件事情,就是对老师上课质量的好坏进行评价。之前好未来有非常好的评价机制,根据这个老师的学生对他的喜好程度进行评价,但是评价周期是以学期为基准。

我们有一个团队,专门评价老师教学质量好坏。我们问最有经验的专家怎么评价这些老师?他说我只要两分钟,看两件事。第一件事是听老师讲课的感觉,二是看老师的板书。

为了做这样一套可以评估每个老师上课质量的系统,我们找到清华大学语音情感方面的专家。要知道,老师有那么多重要的表情需要给予关注,我们应该怎样做这样一套评估系统呢?

解决这个问题的核心是要有科学解决问题的方法论。比如 AI 中有非常经典的解决方法叫做标签、标注,就是一个老师讲得好不好,如果一百个人都说好,只有一个人说不好,那么我们就听一百个人的观点,这是第一类。第二类是,如果家长都说好,其他人说不好,听家长的。第三类是,如果专家说好,小白说不好,那么听专家的。这三个维度一叠加,我们基本上就能确定一个正确的方式。最后我们发现有两个维度最重要,这是我们的 AI 团队拟合出来的,第一个叫做愉悦程度,第二个叫做情感饱和度。

通过这样的判断,我们可以知道,好未来原来有那么多幽默的老师、哪些科目的老师被学生爱戴,这都是可以数据化的,是从数据化通往智能化的一个必经过程。我们目前已经在 15 间教室对这套系统进行了部署,希望未来语音可以解决 85% 以上的问题。

当然,我们不能简单地说哪项数据好,哪个老师就一定好,但是可以据此对老师进行分类。中国历史上有一个看上去准确但实际上不准确的描述,叫做「教无定法」,就是说好的老师有不同的教法。在我看来,「教无定法」只是因为没有强大的机制将其分类。

另一方面,每个老师看到这套系统的结果也会觉得非常有价值,他能知道自己是不是幽默型的,然后再仔细看自己的幽默指数有多少,系统也会告诉他在哪个地方可以做得更好。

Q:对于教育行业来说,学习效果才是企业竞争力的最终评判要素。很多情况下,用户可能无法直接从眼前的产品使用端感受到 AI 能力的存在。那么在你眼中,如何评判一项 AI 技术对于一教育产品的意义和价值?

A:我认为有两件事情很重要。第一件事情叫做价值的外显性,第二件事情叫做理论和学术的支撑。外显性让人产生直觉的信心,理论和学术的支撑是让它产生底层的信心。

把 AI 技术引入教育产品所带来的变化主要体现在三个方面,一是提高系统的运营效率,二是提升学生的学习体验和学习兴趣,三是生成独立的、全新的产品形态。

对于教育而言,AI 更像是一个杠杆和一个支点,可以从方方面面渗透其中并撬动许多业务,让其焕发出更多的生机和活力。

Q:有人把教育比作一个黑盒,如果教学过程没有被数据化,那么教学质量也无法被量化。在各行各业都在发生数据革命的时候,教育行业也是如此。如何最大程度地挖掘教育数据的价值?如何实现数据共享至关重要。好未来在数据上的思考?

A:在教育行业,数据是非常重要的,数据量每年正以十倍的速度增长,未来五年还会继续保持这一态势。

而教育数据的挖掘其实还处在一个非常早期的阶段,每个企业、每个团队都在探索,小到上课时观察微笑次数形成报告发送给家长,大到掌握学生在哪个知识点上没学好。

自适应学习是典型的数据探索。以错题本为例,如果错了一百道题,考试前学生就会去看这一百道题。那么这一百道题有没有共性,能不能结构化缩减,就是一个很大的突破。未来的数据挖掘会越来越成熟的。

数据共享是一个极有价值但实践难度却很大的事情。数据是一个既涉及用户隐私本身又具备巨大商业价值的事情,大家不知道这个保护层如何使用,所以未来行业中可能会有更多的一些契机和技术,包括区块链等技术,促进数据向更加开放和共享的方向前进。目前,我们还只是一个保存者,把它安安全全的保存在这里,并没有充分的发挥出它的价值,还停留在初级阶段。

Q:AI+教育行业仍处于早期发展的升温阶段,粗略统计,目前至少已经有 40 家公司已宣布入场,你如何看待领域发展的现状?

A:不仅是有很多公司宣布入场,其实资本层面也在大规模进入。整体而言,行业内难免出现有产业泡沫、概念模糊的情况。

但从积极的方面看,在新技术进入教育领域的过程当中,聚光灯也随着而来。这意味着,一是会有更多的人才愿意进来,二是更多资本将加大尝试频率、产业可能性也将变得更多。

以人才为例,此前行业内可能大部分都是教育学家,未来则有更多的顶级数学家、统计学家、AI 科学家、甚至是脑科学、基因科学家跨行进入教育领域。AI 这波浪潮过来以后,很多工程师也可能会把进入教育行业作为工作的首选,我认为这具有较大的社会意义。

Q:行业内的真实竞争情况如何?好未来的亮点及护城河是什么?

A:即便众多公司宣布入场做 AI 教育,但大家几乎都在各自不同的领域进行着探索。这个市场很大,大家并不是在一个小小的领域里碰撞、摩擦,而是根据自身优势挖掘问题、解决问题。在这里,好未来有自己的独特之处。

相较于课前预习与课后作业,课中的老师讲课与学生听课其实才是学习最重要的环节。我们认为在「教和学」的主场景里,目前其实缺乏 AI 应用。

在不改变老师的授课习惯和学生学习习惯的前提下,让教室里的学生拥有更好的学习体验、让老师被更好地赋能,是好未来的特色。

而这个特色是基于我们 18000 多名一线老师每天讲课所收集上来的真实问题,这些问题会被提供给 AI 产品经理以及教育专家,抽象成待技术解决的问题,再看当前的技术能否解决。如果没有这个前置能力,是很难切入课中环节的。

好未来的亮点在于对于真实教育环节中出现的问题、痛点和刚需的把握。问题越真实,解决问题就越有力量;问题越不真实,一旦遭遇挫折团队就越容易往回撤。很多公司布局科技研发所碰到的最大瓶颈就在于此,因为它们看不到科技投入以后会给企业、团队所带来的价值。

Q:你曾说过,科技不是为了酷炫,而是要解决教育中面临的真正问题。那么你认为,眼下教育行业需要解决的真正问题究竟是什么?

A:教育本身有很多比较大的问题。从国家政策来讲,教育公平和优质教育资源的短缺是两大问题。

以前好未来投资建希望小学,后来我们发现了更好的方式来做这件事情,就是线上支教,精准扶贫。一方面通过直播技术让好的老师在线扶贫,另一方面把教育的质量提得更高,价格降得更低,甚至提供很多免费的课程。

中国不缺老师,但缺好老师,我们对 AI 的理解本质上是优质教育资源的供给端。要让一个好的老师在 AI 的辅助下覆盖更多的学生,让一个 60 分的老师在 AI 的赋能下达到 80 分到 85 分。

AI 在教育领域会成为一个非常重要的角色,因为所有的系统本身都是科技,包括我们已经研发的 ICS(智能教学系统,现已更名为 ITS)、IPS(智能练习系统,后升级更名为学而思「云学习」)、「魔镜」、「WISROOM」等。我们对未来 AI 在教育领域的最终设想是:AI 教书,老师育人。

产业教育人工智能应用
1
相关数据
区块链技术

区块链是用分布式数据库识别、传播和记载信息的智能化对等网络, 也称为价值互联网。 中本聪在2008年,于《比特币白皮书》中提出“区块链”概念,并在2009年创立了比特币社会网络,开发出第一个区块,即“创世区块”。

阿尔法围棋技术

阿尔法围棋是于2014年开始由英国伦敦Google DeepMind公司开发的人工智能围棋程序。AlphaGo是第一个打败人类职业棋手的计算机程序,也是第一个打败围棋世界冠军的计算机程序,可以说是历史上最强的棋手。 技术上来说,AlphaGo的算法结合了机器学习(machine learning)和树搜索(tree search)技术,并使用了大量的人类、电脑的对弈来进行训练。AlphaGo使用蒙特卡洛树搜索(MCTS:Monte-Carlo Tree Search),以价值网络(value network)和策略网络(policy network)为指导,其中价值网络用于预测游戏的胜利者,策略网络用于选择下一步行动。价值网络和策略网络都是使用深度神经网络技术实现的,神经网络的输入是经过预处理的围棋面板的描述(description of Go board)。

自适应学习技术

自适应学习也称为适应性教学(Adaptive Learning),是一种以计算机作为交互式教学手段的教学方法,根据每个学习者的特别需求,以协调人力资源和调解资源的分配。计算机根据学生的学习需求(如根据学生对问题、任务和经验的反馈)调整教育材料的表达方式。自适应学习技术已经涵盖了来自各个研究领域,包括计算机科学,教育,心理学和脑科学等等。

语音合成技术

语音合成,又称文语转换(Text to Speech)技术,是将人类语音用人工的方式所产生,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。

数据挖掘技术

数据挖掘(英语:data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。

情感计算技术

情感计算(也被称为人工情感智能或情感AI)是基于系统和设备的研究和开发来识别、理解、处理和模拟人的情感。它是一个跨学科领域,涉及计算机科学、心理学和认知科学(cognitive science)。在计算机领域,1995年Rosalind Picard 首次提出affective computing。研究的目的是使得情感能够模拟和计算。这个技术也可以让机器人能够理解人类的情绪状态,并且适应它们的行为,对这些情绪做出适当的反应。这是一个日渐兴起的兴欣领域

智能教学系统技术

智能辅导教学系统(ITS)是一种计算机系统,其目的是向学习者提供即时和定制的指导或反馈,而通常不需要人类老师的干预。 ITS的共同目标是通过使用各种计算技术,以有意义和有效的方式进行学习。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

推荐文章
暂无评论
暂无评论~