松鼠AI出席Developer Week开发者大会,详解AI自适应学习平台背后的核心技术

伴随着技术的发展,网络教育领域先后出现六次变革,分别是互联网+ 浪潮、工具化浪潮、O2O 浪潮、内容获客浪潮、真人一对一浪潮、人工智能浪潮。目前基于人工智能技术的自适应学习系统正在国内外快速发展,那么什么是自适应学习自适应学习平台背后的核心技术是什么?松鼠 AI 在 DeveloperWeek 2019 大会上的两场演讲分别从技术和理念两个方面对此作了介绍,本文简要总结了报告内容。

DeveloperWeek 是旧金山地区规模最大的开发者大会,每年吸引来自 70 多个国家的 8000+ 开发人员、工程师、软件架构师、开发团队、经理和高管聚集在旧金山湾区,探讨最新的开发者技术、语言、平台和工具。DeveloperWeek 覆盖所有新技术,包括 VR 开发、人工智能开发、区块链开发、IoT 开发、无服务器技术、微服务技术、新型 JavaScript 框架等。 

DeveloperWeek 2019 现场。

DeveloperWeek 2019 于 2 月 20 日-24  日在美国旧金山举行,松鼠 AI首席数据科学家 Dan Bindman 参会,并作了主题为《A New Model for Knowledge Assessment and AI Adaptive Learning》的 keynote 演讲,从技术角度解读松鼠 AI 自适应学习平台背后的核心技术。此外,松鼠 AI 与斯坦福国际研究院(SRI)联合实验室研究员 Sam Wang、松鼠 AI 产品经理 Elaine Yin 还做了主题为《How Good Is Good Enough? Learning from Rigorous Evaluations of An AI-powered Education System》的演讲,从理念、产品的角度详细介绍了自适应教育系统。

培生集团在《解码自适应学习》(Decoding Adaptive Learning)的研究报告中,将自适应学习定义为一种教育科技手段,它通过自主提供适合每位学生的独立帮助,在现实中与学生产生实时互动。

知识评估是自适应学习系统中最关键的环节之一,它可以帮助系统了解学生的真实学习水平、学习能力,方便提供个性化的帮助和指导。松鼠AI首席数据科学家 Dan Bindman 在 DeveloperWeek 2019 keynote 演讲中详细介绍了其为自适应学习系统中的知识评估开发的新模型:PKS。

学到多好算好

强大的自适应学习系统应具备三个重要组成部分:高质量和完备的内容体系;连续且精确的学生知识水平「诊断」;最好的「药方」,即最适合学生个体的课程。毫无疑问,如何连续且精确地「诊断」学生的学习状态是非常重要的一环。

松鼠 AI 首席数据科学家 Dan Bindman 在 DeveloperWeek 2019 上发表 keynote 演讲。

松鼠 AI 首席数据科学家 Dan Bindman 的演讲从技术层面上详细讲述了如何评估学生的学习状态。他使用的评估指标是概率知识状态(Probabilistic Knowledge State,PKS),即学生在指定时间内回答出每个问题的概率。PKS 的计算公式如下所示:

 学生在 t 时刻的学习状态由 PKS 来描述,其中 q 表示问题,t 表示时间,Φ 表示标准正态累积分布函数,· 表示向量点积,向量 W(q) 为问题 q 的权重,向量 A(t) 则是学生在 t 时刻的知识能力,而 C(q) 为中心概率值。这里 A(t) 和 W(q) 进行向量点积,向量的维度纯粹为数学概念,没有任何实指意义,且为先验值,Dan 称之为知识轨(knowledge channel)。

举例来看(假设知识轨为 5): 

显然在这个例子中,该学生对问题 q_2 回答得较好,q_1 涉及的知识点则需要进一步巩固,而回答 q_3 则显得有些困难。

在具体实践中,当学生开始一门课程时,由于没有学生的任何历史记录,所以学生的能力 A(t) 初始化为 0。随着学生的学习开始,模型获取学生的历史记录,以精确估计他的知识能力 A(t')。随后基于学生的学习历史记录根据固定规则生成一系列问题,用于评估学生的能力。这里,「测试」和「学习」并没有严格区分,模型从第一个问题到最后一个问题不断更新每个学生的 PKS,为学生推送不同难度系数的学习内容,智能调整学习路径,实现循序渐进的高效学习。而所有问题的选择由 AI 决定。

PKS 是衡量学生知识能力的很好标准,也是自适应学习系统的强大工具。自适应学习的目标是为每个学生提供恰好合适(既不太难也不太容易,而是处在「sweet spot」)的学习内容,促使学生更有效地学习。我们可以利用平均 PKS 来确定学生更适合学习哪个课程,以及确定某个课程中更适合学生的问题。例如:

如上图所示,蓝色代表是太容易的问题,浅绿色代表最合适的问题,红色代表太难的问题。通过这种方法我们可以了解到,对于 Joe 来说这个时间点他应该怎么去选择。比如这里有 A、B、C 三门课,PKS 平均值分别是 0.65、0.79、0.43。显然 C 课程对 Joe 太难了,大部分问题都不知道该如何回答。而课程 B 对 Joe 来讲大部分都是比较容易的,所以整体来说 B 课程太容易了。另一方面 A 课程则大多数问题最合适 Joe,且有少部分较难的,所以接下来的课程安排会尽量安排 A 课程的学习。

平均 PKS 可以表示学生的知识水平,方便教师进行成绩排名,了解学生在班级内的学习水平:

Dan Bindman 从技术角度解读了自适应学习系统中的知识评估模型 PKS,而松鼠 AI 与斯坦福国际研究院(SRI)联合实验室研究员 Sam Wang 和松鼠 AI 产品经理 Elaine Yin 则从理念和产品的角度介绍了松鼠 AI 自适应学习系统。

AI 自适应学习

自适应学习是一种教育科技手段,它通过自主提供适合每位学生的独立帮助,在现实中与学生产生实时互动。

——《解码自适应学习》,培生集团

自适应学习背后的技术简单来讲是将知识分解成许多细粒度知识点,通过不断测试来实时了解学生对不同知识点的掌握程度,并根据学生的掌握程度自动规划下一步学习内容,保证学生一直能够学习最适合自身水平的知识点。

那么自适应学习目前状况如何呢?

创立于 2008 年的 Knewton 是一家自适应教育平台公司,主要面向发行商、学校及全球的学生提供预测性分析及个性化推荐。其核心产品——自适应学习引擎,可以使用个性化数据展现学生的特征,在学生学习数据搜集、个性化学习内容推送等技术上处于领先地位。

欧美国家的自适应学习产业已经发展了几十年,而中国的教育产业也不甘落后。松鼠 AI Elaine Yin 在演讲中介绍了松鼠 AI 的智适应学习系统。

松鼠 AI 的智适应学习系统 

在松鼠 AI 智适应学习系统中,学生的学习之旅。

该演讲还介绍了松鼠 AI 智适应学习系统的几个特点:

  • 在线课程 + 线下学习中心

  • 70% 松鼠 AI 智适应学习系统 + 30% 真人教师

  • 全面详尽的知识图谱,展示超纳米级细粒度知识点

  • 在智适应学习系统中使用 AI 技术达到精准扫描、检测、追根溯源等精准学习效果

  • 采用多模态行为分析 (MIBA) 监测来分析学生面部表情和行为,从而评估学生注意力的集中程度,检测并分析出学生的学习情绪,实现对学生学习状况的准确解读,帮助教师推断出真正的问题区域,从而实施个性化教育。

知识图谱展示细粒度知识点

该演讲展示了松鼠AI智适应学习系统提供的详尽知识图谱和知识点九级拆分。

知识图谱示例。

松鼠AI提供的知识点九级拆分示例。

松鼠 AI 智适应学习系统中的 AI 技术 

  • 松鼠 AI 智适应学习系统利用知识图谱技术和知识空间理论评估学生的知识水平;

  • 利用贝叶斯网络贝叶斯推断、贝叶斯知识追踪和项目反应理论(IRT)掌握学生的实时学习进程,从而评估每个学生对知识的掌握情况并预测未来学习技能;

  • 利用其自适应学习引擎,结合算法、内容、数据和教学设计为学生动态推荐最合适的学习内容。

松鼠 AI 与斯坦福国际研究院(SRI)联合实验室研究员 Sam Wang 在演讲中介绍了 SRI EDU 目前的研究方向:系统性地研究、严谨地评估教育创新的结果,并分享了他关于教育领域人机命题的研究。

在成都的人机教师研究中,研究者从成都市 20 所中学随机抽取 163 名 8 年级学生,将其分为人工智能实验组和专家教师对照组(按照实验前进行的测试成绩平均分配)。两组学生经过将近 6 小时的学习后再次进行测试,结果表明实验组的学生平均分高于对照组。

此外,该演讲还介绍了网络教育的六次浪潮:互联网+ 浪潮、工具化浪潮、O2O 浪潮、内容获客浪潮、真人一对一浪潮、人工智能浪潮。

第一次浪潮是基于互联网的教育,即 MOOC,它部分地解决了教育资源不平等分配的问题,但缺陷是很多学生无法坚持完成课程,且缺乏针对个体的教学。

第二次浪潮是工具化的浪潮。随着移动互联网的发展、智能手机的普及,教学领域中的工具类产品应运而生。工具化满足了学习者的部分需求,但并未解决教育的本质问题,没有介入到教学过程中。

第三次浪潮是 O2O 浪潮,它基于移动互联和位置服务(LBS)技术的成熟,利用 LBS 技术为学习者匹配身边的老师,让用户找到最近、最优质的老师来提供教学服务,起到中介作用。

第四次浪潮是内容获客浪潮。其优势在于逐渐切入教育本质,提供优秀的内容资源。缺点是内容的输出价值感不强,无法形成教学完整闭环。

第五次浪潮则是真人一对一教育,即每个老师每次只教一个学生,针对学生的学习进度设计课程。其优势在于教学质量有保证,师生之间能够实时互动。但是这种教育属于劳动密集型,且不同教师的教学水平参差不齐。

伴随着人工智能的兴起,自适应学习渐渐掀起了教育领域的第六次浪潮。

从这两个演讲中,我们可以较多地了解自适应学习系统,以及 AI 技术在教育行业中的应用。

DeveloperWeek 2019 一览

作为大型开发者大会,DeveloperWeek 2019涉及大量关于开发技术、平台、工具等的讨论。

松鼠 AI 介绍了如何利用 AI 技术助力教育事业,及其智适应学习系统的产品和技术细节。此外,英伟达工程副总裁 Claire Delaunay、Slack 联合创始人和 CTO Cal Henderson、Eventbrite 技术架构师和联合创始人 Renaud Visage、Stack Overflow CTO David Fullerton 等也发表了精彩的演讲。

英伟达工程副总裁 Claire Delaunay 介绍了 ISAAC 平台,ISAAC 是英伟达为机器人创业者进行增强学习的专属训练平台,于 2018 年 6 月推出,集成了软件、硬件和虚拟世界机器人模拟器。拥有 15 年机器人研究经验的 Claire Delaunay 该在演讲中介绍了构建机器人的关键性挑战、AI 在自动机器突破中的关键作用等。

英伟达工程副总裁 Claire Delaunay 现场展示英伟达 ISAAC 平台。

Slack 是增长最快的 SaaS (为企业提供软件服务)公司,它在发展过程中展现了极强的产品扩容性。Slack 联合创始人和 CTO Cal Henderson,也是 O’Reilly 畅销书《构建可扩展的网站》(Building Scalable Websites)的作者,在 keynote 演讲中讲述了云系统对产品扩容性和便捷性的帮助。

Slack 联合创始人和 CTO Cal Henderson(左)在现场。 

在线活动策划服务平台 Eventbrite 成立于 2006 年,经历了多次互联网变革:社交媒体、大数据分析、移动互联网浪潮和 API 的广泛使用。Eventbrite 技术架构师和联合创始人Renaud Visage 分享了 Eventbrite 在这 13 年里从一个简单的网页产品成长为全球活动和票务管理技术平台所面临的机遇与挑战。此外,他还分享了自己对 API 的理解。

Eventbrite 技术架构师和联合创始人 Renaud Visage 的分享。

知名问答社区 Stack Overflow 的 CTO David Fullerton 回顾了 Stack Overflow 十余年的历程,他表示目前 Stack Overflow 每月有超过 5 亿浏览量和 1700 万问题,这些数字不仅仅表示流量和浏览量,还代表数百万开发者在这里互相帮助并节约了大量时间。他表示:「Stack Overflow的愿景是帮助每个开发者学习和分享知识」。

Stack Overflow CTO David Fullerton 的现场演讲。

DeveloperWeek 2019 的主题是「开发者技术时代」(DevTech Age)。正如大会对该主题的诠释:「我们正处于开发者技术时代,开发者技术和工具是最具颠覆性也最基础的技术创新。」

产业自适应学习松鼠AIAI教育
1
相关数据
区块链技术

区块链是用分布式数据库识别、传播和记载信息的智能化对等网络, 也称为价值互联网。 中本聪在2008年,于《比特币白皮书》中提出“区块链”概念,并在2009年创立了比特币社会网络,开发出第一个区块,即“创世区块”。

数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

权重技术

线性模型中特征的系数,或深度网络中的边。训练线性模型的目标是确定每个特征的理想权重。如果权重为 0,则相应的特征对模型来说没有任何贡献。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

数据科学技术

数据科学,又称资料科学,是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

累积分布函数技术

累积分布函数,又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。一般以大写“CDF”(Cumulative Distribution Function)标记。

自适应学习技术

自适应学习也称为适应性教学(Adaptive Learning),是一种以计算机作为交互式教学手段的教学方法,根据每个学习者的特别需求,以协调人力资源和调解资源的分配。计算机根据学生的学习需求(如根据学生对问题、任务和经验的反馈)调整教育材料的表达方式。自适应学习技术已经涵盖了来自各个研究领域,包括计算机科学,教育,心理学和脑科学等等。

贝叶斯推断技术

贝叶斯推断(英语:Bayesian inference)是推论统计的一种方法。这种方法使用贝叶斯定理,在有更多证据及信息时,更新特定假设的概率。贝叶斯推断是统计学(特别是数理统计学)中很重要的技巧之一。贝叶斯更新(Bayesian updating)在序列分析中格外的重要。贝叶斯推断应用在许多的领域中,包括科学、工程学、哲学、医学、体育运动、法律等。在决策论的哲学中,贝叶斯推断和主观概率有密切关系,常常称为贝叶斯概率。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

贝叶斯网络技术

贝叶斯网络(Bayesian network),又称信念网络或是有向无环图模型,是一种概率图型模型。例如,贝叶斯网络可以代表疾病和症状之间的概率关系。 鉴于症状,网络可用于计算各种疾病存在的概率。

暂无评论
暂无评论~