「AI+教育」新进阶,你想跟 AI 智能老师学习吗?

4 月 25 日,葡萄英语在北京举办了「有 AI 的少儿英语·教育+AI 新进阶新技术闭门沙龙」,围绕教育+AI 行业的发展情况进行了深入探讨。

葡萄智学于 2018 年 3 月成立,目前已上线面向 4-12 岁儿童的智能互动英语学习产品——葡萄英语。葡萄智学试图通过互联网思维+AI 技术+优质教育资源来提高教育效率、降低英语学习课程价格,让更多人享受优质的教育资源。

葡萄智学 CEO 茹立云在活动中表示:「事实上,此前市面上已经出现了一些 AI 教育类产品,但大多产品涉及到了测试、练习等比较浅的环节,并没有在最核心的教学环节发挥作用。葡萄英语的 AI 智能老师体系能够在『测试-教学-学习-复习』等整个教学闭环中去影响教学效果,尤其是直指最核心的教学环节。只有解决了最核心的教学环节,才能说英语教育的 AI 元年真正到了。」

那么葡萄英语是如何利用 AI 技术实现目标的呢?

教师

葡萄智学研发了 AI 智能老师体系。葡萄智学 CEO 茹立云指出,通过这套 AI 智能老师体系,葡萄英语能够无限制地复制优质外教老师,提供个性化的学习效果,并能以普惠的价格提供给所有家庭,使得无论一二线还是三四线城市以及农村家庭都能承受。

外教和学伴「淘淘」

用 AI 教师取代真人有何优势呢?

  • 实时性。区别于真人教师,虚拟教师无需预约,可随时上课。
  • 成本低。无需雇佣大量授课教师,从而节省大量成本。
  • 因材施教。葡萄英语通过语音识别与评测、对话系统、图像识别、注意力模型、知识图谱等技术,做到对孩子的学习情况「听其言、观其行、知其因」。

葡萄智学联合创始人韩异凡表示,葡萄英语目前可以实现学习时间自由掌握、学习难度因人而异、课后练习动态补强和个性私教辅导课程四项功能。

课程

葡萄智学在中国北京和英国剑桥分别设立了教研中心,集结中美两地教育专家进行严谨的课程设计和教学方法的研究。

葡萄英语选取牛津大学出版社的知名教材《Let's Go》作为课程的主体内容,自主研发了适合中国孩子的「3+2+1」的智能课程体系,涉及预习、主课、作业、阅读、课后辅导等多个环节。通过提前录制和自动生成,葡萄英语生产出了海量教育内容,以生动趣味,互动性强的方式来为孩子营造「沉浸式」英语语言环境,使孩子们保持学习动力。

技术

活动现场,葡萄智学联合技术创始人佟子健剖析了葡萄英语人工智能技术的核心竞争力,包括儿童语音识别引擎、视觉技术,以及基于详细英语知识图谱构建的能力模型等。

首先,人工智能教师系统进行教学的「核心」是要听懂孩子在说什么,然后进行互动交流。然而市面上的通用语音识别引擎,对儿童语音识别准确率不到 60%,这是因为儿童在学习中不会像成人那样语速缓慢、吐字清晰,孩子们说话的时候会有大量的拖音、漏音、叠音、重复等。而葡萄英语技术团队开发的儿童语音引擎使用 Transformer 的框架加序列鉴别技术,通过 3 万小时语音数据训练,识别准确率已能达到 95%。

然后是重要的「对话」。在交互学习过程中,如何对孩子随机说出的话作出反应?如何增加虚拟教师回复的多样性和趣味性?葡萄智学的对话系统结合语音技术和自然语言理解和生成技术,融合注意力模型和知识图谱,使师生互动更加自然流畅。同时,葡萄英语还引入了语法错误识别模块,可以帮助孩子纠正语法常见错误。

此外,葡萄智学还采用了视觉识别技术,构建了注意力模型、情绪识别模型,通过视线检测、运动检测和表情识别判断学生的学习状态。同时,葡萄英语的教研团队,基于详细的英语知识图谱,建立自己一套针对 4-12 岁孩子英语能力模型,包括听说读写、语法等各种不同维度,总共有 1000 多个知识考察点,分成 50 级的难度,可以更好让人工智能教师系统,依据知识点去评估每个孩子,作出每个孩子精确的英语水平画像。

目前,用 AI 教师取代真人教师进行在线培训的产品还有叮咚课堂、GKid 英语、洋葱数学等。新进阶的「AI+教育」有多大能量,我们拭目以待。

产业AI教育教育葡萄智学
相关数据
自然语言理解技术

自然语言理解是人工智能的核心课题之一,也被广泛认为是最困难和最具标志性的任务。最经典的两个人工智能思想实验——图灵测试和中文房间,都是围绕自然语言理解来构建的。自然语言理解在人工智能技术体系中的重要性不言而喻,它一方面承载着机器和人的交流,另一方面直达知识和逻辑。自然语言理解也是人工智能学者孜孜以求的圣杯,机器学习的巨擘 Michael I. Jordan 就曾经在 Reddit 上的 AMA(Ask Me Anything)栏目中畅想用十亿美元建立一个专门用于自然语言理解的实验室。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

对话系统技术

对话系统大致被分成两类: 任务为导向的对话系统,帮助用户去完成特定任务,比如找商品,订住宿,订餐厅等。实现任务为导向的对话系统,主要有两类方式,流水线方法和端到端方法。非任务导向的对话系统,与用户进行互动并提供回答,简单的说,就是在开放领域的闲聊。实现非任务导向对话系统也主要可分为两类,生成方法和基于检索的方法。

推荐文章
暂无评论
暂无评论~