理论研究
2018年第1期总第175期
教育大数据深度学习的价值取向、挑战及展望
—
在技术促进学习的理解视域中
赵慧琼,姜强,赵蔚
(东北师范大学,吉林长春130117)
【摘要】教育领域中引入深度学习,分析教育大数据以获取有意义的规律与模式、知识与信息,利于学生深层
次理解学习、系统化建构知识,促进实现学习迁移和培养高阶思维。追本溯源,从技术促进学习的视角出发,阐释 教育大数据的具体形成、分析过程及应用价值,梳理深度学习在机器学习和数据挖掘以及教育领域的研究现状。 教育大数据深度学习的价值取向包括学习增强、学习预测、学习迁移、知识表征、精准化学习管理等;同时,在流式 数据、交互式数据、高维数据以及判别式分析等方面探讨教育大数据深度学习面临的挑战,并给予因应策略。教育 大数据深度学习未来发展趋向是人工智能,重点有大数据驱动知识学习、精准教育扶贫、自适应自主学习和基于大 数据智能的在线学习教育平台。
【关键词】教育大数据;深度学习;价值取向;机器学习;人工智能
【中图分类号】G434
【文献标识码】A
【文章编号】
1001 -8700(2018)01 -0017 -09
―、引言
技术融入教学并促进学习方式转变,已经成为 必然趋势,在美国教育部教育技术最新报告《为未 来做准备的学习:重塑技术在教育中的角色》中,更 是突出强调了要利用技术来开展教学[1]。在关联 理解、知识挖掘、脑科学、认知科学、人工智能等新 理论新技术驱动下,并受摩尔定律、梅特卡夫定律 和吉尔德定律的影响,大数据分析和深度学习成为 数据科学研究的中心主题,利用深度学习进行大数 据分析,提取数据蕴含的潜在价值,引领教育结构 的变革与创新。大数据分析的核心是挖掘和提取 大量输入数据中有意义的规律和模式。由于传统 的机器学习和特征工程算法不足以提取大数据中 隐藏的复杂和非线性模式,深度学习作为人工智能 领域一种新兴的机器学习算法,是以数据驱动方式 对分析数据进行一系列的非线性变换,利用分层架
构学习自动提取数据的复杂抽象和表征,成为大数
据分析中极具价值的工具。目前,Google、微软、
IBM、讯飞、百度、腾讯、阿里巴巴、蚂蚁金服等国内
外知名的拥有大数据的互联网公司都纷纷加强对 深度学习的探究,并获得一系列显著成果,如Gogle 旗下的DeepMind团队采用深度学习技术开发的人 工智能程序AlphaGo[2]和开源深度学习环境Tensor-
Fl〇w。大数据时代,《中国制造2025》的深入实施,
促进深度学习焕发蓬勃生机,并在教育教学领域掀 起一股热潮。2017高等教育版新媒体联盟《地平线 报告》指出,2017—2021年间最有可能促进高等教 育领域技术运用的关键趋势之一就是深度学习方 法,利用该方法可以更直观地响应学习者并与他们 交流,提升在线学习、自适应学习软件和模拟软件 的用户体验[]。将深度学习引入教育领域,以分析 日渐增长的教育教学相关数据,从中获取未被提炼 的、复杂抽象的信息与知识,逐渐探索一种运用技
【基金项目】国家社会科学基金教育学一般项目“基于大数据的在线学习精准预警与干预机制研究”(编号:BCA170074)。 【作者简介】赵慧琼,东北师范大学信息科学与技术学院硕士研究生;姜强,博士,东北师范大学信息科学与技术学院副教授, 硕士生导师;赵蔚,博士,东北师范大学信息科学与技术学院教授,博士生导师。
17
术促进学习的创造性理念与方式,用于改善学习质 量。鉴于此,本研究在解读教育大数据潜在价值的 基础上,总结深度学习在机器学习领域和教育教学 领域的发展现状,着重讨论教育领域中利用深度学 习分析教育大数据的机遇、挑战及未来发展,以便 全方位、深层次地追溯教育大数据的巨大价值,从 而优化学习过程,提高学习效率。
二、教育大数据发展潜能
数据科学的兴起加速了大数据价值化的进程, 视角,撷取第十五届教育技术国际论坛(IFET)主旨 报告和论文中的主要观点,总结了大数据教育的具 体应用趋势[1]。此外,国内外一些在线教育公司充 分发挥大数据分析的应用价值,如
Knewton公司研
发的大数据自适应学习系统,通过收集学习内容和 互动交流等学生数据,利用模型计算、心理测试和 策略反馈等引擎进行分析,向学生提供下一步学习 的引导和建议,实施个性化学习。百年英才依据云 计算和数据挖掘等技术,整理分析数十年精准海量 高考数据,设计开发高考志愿填报系统和专业选择 改变了人类的生产生活方式,也颠覆了教育系统的 常规模式。国务院《促进大数据发展行动纲要》提 出“探索发挥大数据对变革教育方式、促进教育公 平、提升教育质量的支撑作用”,《教育信息化“十三 五”规划》强调发挥大数据在教育管理与学习空间 中的重要作用。杨宗凯教授提出,“十三五”期间, 大数据与教育的深度融合已成为必然趋势[4]。胡 弼成等认为教育系统的大数据可促进教与学的过 程,推进教育决策科学化,促使教育评价更具全面 客观性,完善教育质量监控体系,并指出教育大数 据对于教学变革、教育科研变革、教育管理变革和 教育评价变革等的推动作用[5]。杨现民等认为教 育大数据应作为敦促教育变革的新型战略资产、科 学力量和智慧教育发展的基石,提出教育大数据的 最终价值在于实现教育管理的科学化、教学模式改 革、个性化学习的实现、教育评价体系的重构、科学 研究范式的转型以及教育服务的人性化[]。
通过分析教育大数据,挖掘其背后的极大潜 能,获取有意义的教与学信息和知识,有助于优化 教学过程,改善学习成效。姜强等利用教育数据挖 掘和可视化技术,从个人、同伴及个体与班级视角 设计的学习分析仪表盘,以直观的图形图像方式, 实时动态地展现学生学习行为数据,促使教师持续 了解学生学习情况、评估学生学习表现,并及时调 整与反思教学[7]。方海光等通过跟踪记录与分析
MOOC学习者的在线学习行为,利用量化自我算法
挖掘学习者相关学习信息,以报告的形式展示学习 者的学习现状,使学习者实时了解自己的学习进 展,及时查漏补缺,从而促进学习任务的高效完成, 提升学习质量[]。杨雪等建构的基于大数据个性 化学习体系框架,有助于反思教育教学,推动个性 化学习的实现[],并以大数据分析与教育改革为主
18
系统,围绕海量、多样、持续增长的高考数据进行数 据挖掘与建模分析,为毕业生高考志愿填报和专业 选择提供精准科学的指导。创数教育集团基于自 适应技术推出的“学生个性化学习”产品,通过跟踪 分析学生的学习痕迹数据,帮助其精确定位个人学 习缺陷,根据学习者个体能力,规划不同的学习路 径,推荐适合的个性化学习内容和任务,促进自主 学习效率大幅度提升。
分析教育大数据以获取有意义的规律与模式、 信息与知识的基本前提是明确教育大数据的生成 过程。邢蓓蓓等指出教育大数据产生于学校环境 下的教学活动、管理活动、科研活动和学校生活等 教育活动中,学生在家庭、社区、博物馆等社会环境 下进行学习活动生成的学习记录也属于教育大数 据[11]。本研究从学习者角度,总结教育大数据由学 生数据、学习资源、通用数据和数据工具四部分组
成,如图1所示。
学生数据作为构成教育大数据的基本要素,包 括学生先前学习经验数据即历史数据、学生个人基 本信息和当前学习状态下正在生成的学习数据;学 习资源是教育大数据产生的重要途径,主要指学生 学习过程所需的相关学习材料和学习环境;通用数 据是教育大数据的关键来源,包含课程数据、教学 数据和教育管理数据;数据工具是教育大数据价值 化的主要手段,较为普及的方法有协同过滤技术、 分类和聚类等。
教育大数据形成过程中,学生先前的学习痕 迹、学生个体的信息数据、学习资源数据、学校管理 数据以及课程教学生成的多样化数据等融入通用 数据,构成多源性、异质性和碎片化的海量教育数 据;数据工具的使用将大规模教育原始数据通过收 集、处理、分析和解释,转换为有价值的知识与信
息。由于教育数据的规模性、多样性、易变性和模 糊性,数据采集时需要跟踪与分析数据来源,确定 数据类型和格式,整合异构数据,并测评数据存储 能力;处理时考虑到数据的时效性、真实性和有效 性,应倾向于验证数据质量,缩减数据规模,以并行 或分布方式清理数据;分析阶段则根据不同的应用 需求,选择不同的数据集,采用诸如教育数据挖掘 和学习分析技术等方法进行分析;解释阶段是将数
据分析得到的结果利用可视化技术进行解释以便 用户识别和理解。诚然,整个过程中需要特别注意 数据的隐私安全与伦理道德问题,赵慧琼等从技术 视角搭建的大数据学习分析安全与隐私保护框架, 旨在应对教育大数据分析面临的隐私泄露、访问权 限和可信性挑战,并提出一系列数据保护策略,以 便缓解数据使用时涉及的隐私伦理问题[13]。
正在
生成的
、数据>
历史
数据
个人基本信息
数据工具
教育管理 数据
图1教育大数据概念模型[12]
三、深度学习:一种有效学习方式
大数据背景下,深度学习已经成为一种有效且 重要的学习方式和学习理念。目前,加拿大多伦多 大学的Geoffrey Hinton、纽约大学的Yann LeCun和 加拿大蒙特利尔大学的Yoshua Bengio、谷歌技术总 监
实基础。
(一)机器学习与数据挖掘中的深度学习机器学习中,深度学习是指在不同层次上利用 一系列非线性变换对数据进行复杂抽象表征的算 法[14],可分为有监督特征学习和无监督特征学习, 不同学习框架下使用的学习算法是不同的,例如, 卷积神经网络和循环神经网络是基于有监督深度 学习建立的学习模型,而自动编码器、玻尔兹曼机 和深度置信网络则属于无监督深度学习算法。有 监督特征学习也称为有教师学习,是通过训练数据 集中建立模型来预测未知,无监督学习则自动从数 据中提取学习特征,在提取数据分析过程中发现有 效信息[1]。深度学习是基于人工智能领域类神经 网络的发展,通过模仿人类大脑的层次学习方法自 动提取复杂的抽象表征,以便在更高层次上建立表 征学习的神经网络[1]。
Kurzweil、美国斯坦福大学计算机科学系李飞飞、 特斯拉AI主管Andrej Karpathy、深度好奇创始人兼 CTO吕正东博士、Deepleerning. ai创始人吴恩达、中
国科学院院士兼中国人工智能学会副理事长谭铁
牛、中国科学技术大学陈恩红、清华大学张钹、西安 电子科技大学高新波和香港科技大学杨强等均致 力于深度学习研究并取得了杰出成就。通过对机 器学习与数据挖掘以及教育教学领域中深度学习 发展现状进行梳理,充分认识未来教学融人深度学 习的重要性,为教育大数据深度学习的应用奠定坚
19
深度学习在语音识别、图像识别和自然语言处 习发展的意义,总结深度学习特有的优势在于面向 问题解决、强调信息整合、注重批判理解、完善知识 建构、促进迁移运用和提倡终身学习等[2]。Huber-
crosoft 公司在中国天津公开展示的全自动同声翻译
系统,实现了自动化语音识别和中文语音合成,支
理等诸多应用领域取得了一系列显著成果。Mi
man等利用深度学习的理念和方式,通过确定学习
ral Network, TON) , 深度学习算法有助于提高语音 识别的精确度[17]。Tuerxun M等提出的基于深度神
经网络声学建模方法,与传统建模方法相比能更为 有效地提取声学特征,并将其成功应用在维吾尔语 大量词汇的连续语音识别中[18]。在图像识别领域, 撑其运转的关键技术就是深度神经网络(Deep Neu
目标,设计基于项目的学习方案,同时为教学过程 提供学习支持,优化教学策略,评估学习内容,促进 学习者接收和掌握知识,并提高批判性思维能
力[2]。Bier等认为随着信息技术的发展,学习者 进行深度学习的几率增大,使得新知识与原有知识 和实践经验之间能够建立紧密联系,有助于培养学 已经连续举办六年的ImageNet计算机视觉识别挑 占戈赛(ImageNet ILSVRCLarge Scale Visual Recognition Chal
lenge , ) 是图像分类算 法评估 的重要赛事,
尤其在ILSVRC2015中,微软亚洲研究院团队构建
含有超过百层的深层残差网络,以图像分类数据集 上最低的错误率取得图像检测和图像分类项目的 冠军[1]。
Google Brain项目中Le等利用完全无监
督、无标注的图像数据集进行训练,学习到的人脸 特征可成功用于图像分类[則。Facebook的Deep- Face 项目和香港中文大学提出的 DeepID 项 目使得
人脸识别技术的正确率几乎与人类相媲美。在自 然语言领域,Gloot等利用深度学习算法解决用户 情(Stacked感分类Denoising问题,通过使用堆叠降噪自动编码器 Autoencoder,SDAE)对在线评价中的无监督数据进行训练,以提取复杂抽象的特征
表示[1]。Mikolov等从含有数亿个单词和数百万个 词汇的数据集里引入学习高质量词向量的技术,旨 在学习单词的分布式表示,并演示了将Wod2 Vector 模型应用于自然语言翻译的过程,成为词向量的典 型案例[2]。
(二)教育领域中的深度学习
不同于机器学习和数据挖掘中的深度学习,教 育教学领域的深度学习是有意义的理解学习,且属 于主动学习的一种,是指在原有认知结构基础上, 批判性地学习和掌握新知识,建立新旧知识间的联 系,并将习得的知识迁移应用到不同的情境学习 中,以辅助其作出决策和解决问题。Enwile等就 深度学习和浅层学习在创新、评价、分析、应用、理 解和识记的目标层次上进行特征比较,而且详细阐 释了两者的相关理论基础[23]。张浩等从建构主义 理论和情境认知理论角度讨论了其对深度学习的 影响,指出分布式理论和元认知理论对引领深度学
20
习者高阶思维能力,更好地解决复杂学习问题[2]。 段金菊等指出,深度学习比较强调认知结构层次的 高度和学习过程的元认知与反思能力,关注复杂认 知和高阶思维的养成,重视学习发生时的高情感和 高行为投入[27]。樊雅琴等采用内容分析法对国内 深度学习研究现状进行梳理,从深度学习的理论研 究、方法研究、应用研究、资源建设、相关技术和评 价研究等方面解读了深度学习的发展趋势[2]。
四、教育大数据深度学习的价值取向
教育部在2010年颁布的《国家中长期教育改 革和发展规划纲要(2010 -2020年)》和2013年颁 布的《教育部关于推进中小学教育质量综合评价改 革的意见》中均指出收集分析学生的成长记录与学 习数据,着重突显教育大数据深层价值的可塑性。 基于层次架构的深度学习,通过对海量数据从较低 层级训练到较高层级复杂规律与模式的抽取,完成 数据价值的有效提炼,其主要优势是从大规模未标 记、无监督数据中有层次地学习,以提取有意义的 抽象表示和特征。将深度学习引入教育领域,为学 习增强、学习预测、学习迁移、知识表征和精准化学 习管理等教与学实践带来了重要发展机遇。
(一)学习增强
学习增强是学习者根据自身的学习特征和需 求,在先前学习经历的基础上进行深层次的主动学 习和知识创新,加深新旧知识间的内在联系,完善 所建构的知识结构体系,其最终目标是通过不断强 化和反思学习来获得高水准的学习结果,从而提升 学习质量。刘宇等依据深层学习过程的动机生成、 知识习得、理解领悟、迁移应用、反思评价和创造六 个阶段,分别从教师教学和学生学习角度,提出在 学习社区提供学习支持、开展创新型教学、构建知
识关系、建立学习共同体、进行反思评价等建议,激 发学生学习动机和认知需求,培养学生思维能力和 迁移能力,以促进学生的学习增强[29]。随着教育信 息化的深入推进,数据驱动学习应运而生,教育大 数据深度学习的演变能够满足学生学习增强新常 态的需求,并使其成为积极探索学习增强的支撑力 量。利用深度学习分析挖掘教育大数据,获得学习 行为中有意义的高级抽象数据表征,揭示行为数据 中的复杂关系和语义关联,以便更好地领悟学习者 的学习需求,发现学习规律,为有效实现学习增强 巩固强化又是持续深化的一种学习,它的发生需要 学生主体的记忆力、想象力和思维能力等共同参 与。冯锐等基于案例的推理将学习迁移过程分为 从记忆中寻找相似的案例知识、确定适用于新学习 的案例和应用评估最优案例三个阶段,帮助学习者 自发地理解并编码知识,完成学习的有效迁移[31]。 数据革命的到来,使“一切用数据说话”成为基本要 求,作为教育大数据深度学习的一个重要趋向,学 习迁移更应如此。利用深度学习分析教育大数据 能够把初始数据从底层转换到高层,提炼有价值的 提供极大潜能。运用深度学习对学生学习过程生 成的海量数据进行客观合理地分析,提取学习数据 隐含的规律与模式,从中识别学习者的学习特征和 学习状态,依据学习内容的结构向学习者提供适应 性的学习资源服务,以推动学习的持续增强。
(二) 学习预测
学习预测立足于教育大数据深度学习的结果, 通过分析学习过程中的大量历史数据,对学习者未 来的学习表现进行合理化预测,并发现可能存在的 问题,其最终目的是有针对性地进行干预,消除学 习者未来学习中的不确定因素,以更好地提高学习 成效。李彤彤等基于教育大数据和学习分析技术, 构建以干预引擎为核心的结构预测干预模型,以发 现学习者的学习困难、提升学习者的学习效果为目 标,识别出学习者的学习状态,如学习任务完成情 况、学习内容掌握情况等,准确预测学习者的学习 状况,并实施有效的干预策略[3°]。而作为人工智能 领域发展的里程碑,深度学习同样也可分析教育大 数据,以达到学习预测和干预的效果。教育大数据 背景下,使用深度学习构建学习行为数据的复杂表 征,从中提取有价值的信息与知识,有助于对未来 可能存在学习风险的学生作出预测,并针对发现的 学习问题进行适当的干预,促进学习绩效的稳步提 升。教育大数据深度学习分析结果是生成与学习 者学习行为相关的学习预测模型,结合相应的学习 情境,对学习者的未来学习表现如学习进展情况等 进行预测,并判断学习者是否存在学习危机,以帮 助学习者顺利完成课程学习,改善学习状态,优化 学习效果。
(三) 学习迁移
学习迁移,是将一种学习情境下习得的知识经 验、技能和态度等应用到另一种学习情境中,既是
教与学信息,有利于学习者多方面深层次诠释已有 知识,建立新旧知识间的联系,找寻发现其中隐含 的相似性,进而运用已有的知识经验来习得新知 识,推动学习迁移的成功实现。教育大数据深度学 习的应用发展,促使学习从一个情境到另一个情境 的不同层次迁移成为必然,持续深入的学习迁移有 助于学生知识体系的不断完善,学习效率的逐渐 提升。
(四)知识表征
知识表征强调以可视化的方式表达知识结构 中的知识对象、属性以及关系,是一种知识外显的 形式,也是学习者习得知识的关键。学习者的知识 表征过程是通过概括所学知识及知识间的联系,获 得结构化的知识体系,并建立新旧知识间有意义的 关联,以加深学习者对已有知识的理解程度,有利 于学习效果的提升。顾小清等认为知识可视化表 征主要包括语义处理方式、符号及其使用方式和知 识结构与关系三个方面,概念、概念属性、概念结构 与关系是知识语义的重要要素,学习者完成知识建 构需要解决促进知识理解和掌握、促进知识建模与 应用两个问题,才能领悟知识的实际意义与价 值[32]。因此,知识的可视化表征需要进一步继承与 创新。深度学习应用于教育大数据分析过程,得到 的复杂数据表征包含语义和关系信息,借助可视化 技术可获取与学习者相关的规律与模式,从而在学 习活动中帮助学习者表征抽象的信息,促进习得知 识从记忆到理解的转换。教育大数据深度学习挖 掘的价值化教与学信息,将有利于学习者建立知识 与知识间的关联,进行深层次的信息加工和可视化 知识表征,以完成学习者个人的知识体系构建。实 现知识迁移与应用,可以更好地激发学习者内在动 机,引发自主学习,提高学习质量。
21
(五)精准化学习管理
大数据背景下的学习管理是通过采集学生学 习过程产生的全部数据,运用新的数据处理和分析 方法建立多维模型,了解学生整体的学习状况,对 可能存在学习危机的学生尽早发出预警信号,并给 予相应的学习指导建议,进而改善学习效果,提升 学习效率。孙洪涛等在总结数据驱动管理的三个 典型应用基础上,强调数据模型对学习管理的重要 调节作用,并从广泛数据收集、科学建模过程和结 构化模型三个方面构建教育数据支持下的学习管 映射能够改进判别式或生成性目标函数,然而,单 调增加特征可能导致大量冗余特征和数据的过拟 合。Calandra等引入自适应深度置信网络(
Deep Belief Network, aDBN)处理在线流式数据,利
adaptive
用深度置信网络的生成属性,从原始数据中模拟样 本,并将其用于适合观察到数据的新深度置信网 络,从而演示了深度学习在在线非稳定和流动数据 中的学习过程[35]。但是,自适应深度置信网络对恒 定存储器的内存消耗需求较大,使其在训练大规模 流式数据时受到限制。因此,为了有效处理和分析 理模型,以便辅助教师和管理者对学生学习状况持 续动态分析和综合评估,及早发现学生存在的学习 问题,有针对性地提供学习意见[33]。教育数据的模 糊性和复杂性,使得数据建模过程面临诸多难题, 导致学习管理的效率降低,深度学习对实现精准学 习管理具有重要的支撑作用。教育大数据深度学 习采用分层架构学习方式,逐层训练大规模数据 集,以提取抽象复杂的数据表征,从较高层次的数 据表征中发现学习规律、获取学习模式,有助于明 晰学生的学习情况,评估学生的学习表现,提前发 现并解决学生的学习困难,以提高学习管理的质量。
五、挑战及应对策略
教育大数据深度学习为教育教学带来了发展 机遇,突出显示了深度学习的适用性和优势。然 而,事物的两面性决定挑战是伴随机遇而来的。为 充分发挥教育大数据深度学习的巨大潜能,必须针 对教育大数据分析中难以处理的相关数据属性和 特征不断修改和调整深度学习,以达到高效挖掘教 育数据潜在价值的硬性要求。本研究从流式数据、 交互式数据、高维数据和判别式分析四个深度学习 亟待解决的问题出发,详细论述了教育大数据深度 学习需要迎接的挑战,并提出了应对策略。
(一)流式数据
教育大数据深度学习的挑战之一是处理流媒 体和快速移动的在线数据,分析这类数据有利于执 行监控跟踪任务,如监督学习者学习活动。因为需 要能够处理大量连续在线数据的算法,所以对于深 度Zhou学习适应流式数据的训练提出了更高的要求。 等采用降噪自动编码器coder(Denoising auto - en, DAE) ,将深度学习算法应用于大规模流动数
据的增量特征学习[34]。虽然这种增量特征学习和
22
大规模、快速移动的流式数据,如网络点击流数据、 社交媒体流数据、学生操作日志和计量数据等,有 必要对深度学习算法进一步有针对性地探索和 研究。
(二) 交互式数据
鉴于互联网的飞速发展和在线用户数量的指 数式上升,用户与网络平台之间的交互日益频繁, 数据收集的规模日益增长,如社交网络、搜索引擎、 通讯工具、电子邮件、学习管理系统和教学管理系 统等保留和存储的海量数据,促使交互式数据对深 度学习算法提出更高的要求。在ImageNet计算机
视觉竞赛中,Krihevky等人演示了采用深度卷积
神经网络NN(
Deep Convolutional Neural Network,DC- )方法训练大规模ImageNet数据集,通过逐层学
习和提取图像特征,对图像数据进行标记,成功用 于形成有意义的图像检索和分类表示,并在大规模
图像检索和分类任务中取得较好的结果[36]。
Zeiler
等在Krizhevsky提出的卷积神经网络模型基础上, 运用可视化方法对每一个卷积网络层进行分析,从 而学习得到图像特征,加深了卷积神经网络对大规 模图像数据集的训练与理解,并在ImageNet上取得 进一步的成功[37]。然而,利用现存的深度学习算法 处理交互式数据,使得数据操作过程比较耗费时 间,无法满足其实时性的需求,为实现交互式数据 的快速查询与索引,必须引进或开发处理速度较快 的深度学习算法。
(三) 高维数据
因为深度学习是从较低层到较高层的分层架 构中学习数据的复杂抽象和表示,以提取有价值的 规律与模式,所以现有的深度学习算法在处理高维 数据时计算开销可能比较大;也就是说,这些深度 学习算法在处理大量高维教育数据时可能受到阻
碍,急需开发基于深度学习的新解决方案。Chen等
的形式,将输人层的图像与数据库的图像相匹配, 通过验证图像之间的一致性来执行判别式任务,从 而实现对目标图像的精确识别[41]。虽然深度学习 算法体系中已存在完成判别式分析的应对方案,但 是由于教育大数据中判别式分析要求的计算开销 越小越好,所以,为充分发挥教育大数据深度学习 的效用,对于深度学习算法体系的探索与创新必须 是不间断地、持续进行地。
六、未来发展方向
在未来应用发展中,应借助云计算环境,以大 数据为基础,采用深度学习方法,大力发展人工智
能,如图2所示。人类社会发展经历了农耕社会、工 业社会、信息社会,进人到智能社会,从发明动力工 具发展到发明智能工具,从认识客观世界、改造客 观世界发展到探索人脑认知、认识人类自身的新阶 段,不断提升创新驱动发展源头的供给能力。牛津 大学的卡尔•弗瑞和迈克尔•奥斯本在2013年发 表了《就业的未来》研究报告,调查各项工作在未来 2°年被智能机器人取代的可能性。谷歌未来科学 家雷•库兹韦尔在《奇点临近》一书中预测,2045 年,智能机器人将替代人类劳动力,具有人类的思 维、意识、推理、记忆、学习、交互等智能活动的机 理,实现类脑认知。近年来,欧盟、美国、英国、俄罗 斯、日本等纷纷制定了人工智能国家发展计划,2° 15 年国务院将“互联网+人工智能”列为重点行动,次 年发改委联合科技部、工信部和网信办又出台《“互 联网+ ”人工智能三年行动实施方案》。2017全国 两会中,李克强总理提出“全面实施战略性新兴产 业发展规划,加快培育壮大新材料、新能源、人工智 能等技术的研发和健康发展”[42],首次将人工智能 写人《政府工作报告》中,充分彰显了人工智能的战 略地位。2017年7月国务院关于印发的《新一代人
Stacked Demising Autoencoder,mSDAE),在训练过
程中使噪声边缘化以避免使用随机梯度下降或其 他优化算法来学习参数,而且边缘化降噪自动编码 器仅包含控制噪声量和堆叠层数两个自由元参数, 这将有利于简化模型的选择过程,促进高维数据的 有效扩展,并且相比于常规堆叠降噪自动编码器, 该算法的计算速度更快、实施过程更简单[38]。
Krizhevsky和Hinton等提出有效处理高维数据的方 法是卷积神经网络,利用ImageNet图像数据集上的 卷积神经网络,由于该网络隐藏层单元中的神经元 不需要连接上一层的所有节点,而是仅连接到相应 空间区域中的神经元,所以,在向网络的较高层移 动时,图像数据的分辨率会随之降低,以实现对高 维图像数据的有效处理,并取得扩展高维数据的先 进结果[39]。尽管大数据分析中采用了深度学习相 关算法解决了高维数据的问题,但是深度学习在高 维教育数据处理方面的应用有待进一步探索,以便 开发基于深度学习的解决方案,处理教育大数据分 析领域中的高维度问题。
(四)判别式分析
判别式分析作为教育大数据分析的主要工具, 可以利用深度学习算法从原始数据中提取复杂非 线性特征,并使用简单线性模型,以提取的特征为 输人来执行判别式任务,其优点在于,通过深度学 习得到的特征为数据分析増加了非线性特征,将判 别式任务与人工智能紧密结合;提取的特征应用相 对简单线性分析模型更具计算效率。Sun等利用深 度隐藏身份特征方法,将人脸图像数据作为卷积神 经网络的输人层,执行判别式训练过程,在较高层 级学习高级抽象特征,以完成人脸识别的任务[4°]。 Wang等提出的实例级目标识别方法,以图像检索
引人的边缘化堆叠降噪自动编码器(marginalized
云计算
大数据驱动知识学习精准教育扶贫自适应自主学习
大数据基础
深度学习方法
图2
深度学习未来发展趋向
基于大数据智能的在线学习教育平台
23
工智能发展规划》明确指出,“利用智能技术加快推 动人才培养模式、教学方法改革,构建包含智能学 习、交互式学习的新型教育体系,呈现出深度学习、 跨界融合、人机协同、群智开放、自主操控等新特 征”,并强调了普及中小学阶段人工智能教育[43]。
1. 大数据驱动知识学习
利用人工智能着重突破知识挖掘、知识加工、 知识计算等技术,建立数据驱动的知识演化模型, 实现从大数据到信息、信息到知识的自动获取与生 成。通过对可观测的教育数据进行采集、存储、分 习教育平台。建立基于大数据智能的在线学习教 育平台,需要搭建以学习者为中心的学习环境,开 发深层次、智能化、全面性的学习分析系统,为教 师、学生、管理者等提供精准的教育教学服务,有助 于推动个性化学习和终身学习的发展,实现合理有 效地运用技术促进学习,提升教育质量。
【参考文献】
[]丁钢.基于技术的教学:如何重新定位教师角色
析与解释等深层次变换,更精准地理解学生主体的 认知行为,建立与学习行为相关的模型结构,以挖 掘数据背后的学习信息,从中提炼规律,与已有知 识进行关联理解与表征,最终形成具有概念识别、 动态实用的知识图谱,明晰学生当下的学习状况, 并预测其未来的学习动向,促使学生的学习回归本 真世界。
2. 精准教育扶贫
利用人工智能着重突破群体感知、精准定位、 增强现实等技术,建立科学合理的督导评估机制, 准确识别学校中的贫困学子,及时主动为其提供教 育特殊支持,以促进教育均衡发展。通过跟踪记录 在校生的学习生活数据,了解其家庭经济状况,对 贫困学生进行综合评估,按照贫困指数的大小,分 年限、分群体、分阶段稳步精准向帮扶对象增加资 源供给,满足其基本的教育需求,保障其学业的顺 利完成。
3.
自适应自主学习
满足差异学习个体的需求,是教育最根本的宗 旨。利用人工智能着重突破人机交互、大众化协同 和开放式共享等技术,实现对学生的智能感知、预 测预警和个性化评价,及时把握学生的认知特征和 心理变化,促使其进行适应性的、无监督的自主学 习。基于同步反馈的学习数据分析结果,帮助学生 进行自我总结与反思,依据推送的个性化服务资 源,相应地调整学习策略,更改学习路径,以推动个 性化自适应自主学习的发生,有利于提高学生的学 习能力和认知水平,改善学习质量[4]。
4. 基于大数据智能的在线学习教育平台利用人工智能技术能够推动学习方式与教学 模式的转变,构建基于互联网的新型智能教育体 系,形成教学、管理和资源建设三位一体的在线学
24
[J].现代远程教育研究,2017(3) :44 - 49.
[2] Silver D,Huang A, Maddison CJ, et al. Mastering the game of Go with deep neural networks and tree search [ J ].Nature, 2016,529(7587) :484.
[3 ]金慧,胡盈滢,宋蕾.技术促进教育创新一一新媒体 联盟《地平线报告》(2017高等教育版)解读[J].远程教育 杂志,2017(2):-8.
[4] 光明日报.杨宗凯:大数据驱动教育变革与[EB/OL].[2017 - 04 - 18].http://news.gmw.cn/2017- 04/18/content_24226384. htim.
[5] 胡弼成,王祖霖.“大数据”对教育的作用、挑战及
育变革趋势——
大数据时代教育变革的最新研究进展综述
[J].现代大学教育,2015(4) /8 -104.[6 ]杨现民,唐斯斯,李冀红.发展教育大数据:内涵、价 值和挑战[J].现代远程教育研究,2016(1) /0 -61.
[7]姜强,赵蔚,李勇帆,等.基于大数据的学习分析仪 表盘研究[].中国电化教育,017(1)/12-120.
[]方海光,罗金萍,陈俊达,等.基于教育大数据的量 化自我MOOC自适应学习系统研究[].电化教育研究, 2016(11) /8 -42.
[9] 杨雪,姜强,赵蔚.大数据学习分析支持个性化学研究—技术回归教育本质[J].现代远距离教育,2016 (4) /1 -78.
[10] 杨雪,姜强,赵蔚.大数据分析与教育改革——2016年第十五届教育技术国际论坛的思考[].现代远距离 教育,2017(2):62 -75.
[11] 邢蓓蓓,杨现民,李勤生.教育大数据的来源与集技术[J].现代教育技术,2016(8) /4 -21.
[12 ] Terziava V, Todorova K, Kademova - Katzarova P. Big Data - Opportunities and Challenges for Education [ R ]. Plovdiv : Institute of Mathematics and Informatics Bulgarian Academy of Sciences, 2015 :136 - 145.
[13] 赵慧琼,姜强,赵蔚.大数据学习分析的安全与私保护研究[].现代教育技术,2016(3) / -11.
[14] Lecun Y, Bengio Y, Hinton G. Deep learning [ J ]. Nature, 2015,21(7553) :436 -444.
创[15] Radford A, Metz L, Chintala S. Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Net^vorks[ J]. Computer Science, 2015.
[16 ] Schmidhuber J. Deep Learning in neural networks: An overview[J]. Neural Networks,2015,61 :85 -117.
[17 ] Markoff J. Scientists see promise in deep - learning programs[ EB/OL]. [2012 - 11 -23]. http://'www. nytimes. com/2012/11/24/science/scientists - see - advances - in - deep - learning - a - part - of - artificial - intelligence, html? pagewanted = all&一r =0.
[18 ] Tuerxun M,Dai L. Deep Neural Network based Uy- ghur Large Vocabulary Continuous Speech Recognition [ J ]. [30 ]李彤彤,黄洛颖,邹蕊,等.基于教育大数据的学习 干预模型构建[].中国电化教育,2016(6) :16 -20.
[31 ]冯锐,杨红美.基于案例推理的学习迁移研究[J]. 电化教育研究,2015(7) :78 -82.
[32] 顾小清,权国龙.以语义图示实现可视化知识表与建模的研究综述[J].电化教育研究,201/(5) :45 -52.
[33] 孙洪涛,郑勤华.教育大数据的核心技术、应用状与发展趋势[J].远程教育杂志,2016(5) :1 -49.
[3/] Zhou G, Sohn K, Lee H. Online Incremental Feature Learning with Denoising Autoencoders [ J ]. Ann Arbor,2012 : 1453 -1461.
[35 ] Calandra R,Raiko T,Deisenroth M P, et al. LearnJournal of Data Acquisition & Processing, 2015,30 ( 2 ) : 365 -371.
[19] He K, Zhang X, Ren S,et al. Deep residual learning for image recognition [ EB/OL ]. http ://arxiv. org/abs/ 1512.03385,2015.
[20] Le QV. Building high - level features using large scale unsupervised learning [ C]. IEEE International Conference on Acoustics, Speech and Signal Processing. IEEE, 2013:8595-8598.
[21] Glorot X,Bordes A, Bengio Y. Domain Adaptation for Large - Scale Sentiment Classification: A Deep Learning Approach [C ]. International Conference on Machine Learning. 2011 /13 -520.
[22] Mikolov T,Chen K,Corrado G,et al. Efficient Estimation of Word Representations in Vector Space [J]. Computer Science, 2013.
[23] [27]段金菊,余胜泉.学习科学视域下的e -Learn- mg深度学习研究[].远程教育杂志,2013(4) :/3-51.
[/]张浩,吴秀娟.深度学习的内涵及认知理论基础探 析[J].中国电化教育,2012(10) / -11,21.
[25] Mette Huberman, Catherine Bitter, Jennifer Anthony, Jennifer O ’ Day. The Shape of Deeper Learning : Strategies, Structures, and Cultures in Deeper Learning Network High Schools[ J]. American Institutes for Research.
[26] Bitter C,O’ Day J. Providing Opportunities for Deeper Learning: Findings from the Study of Deeper Learning[ J]. Society for Research on Educational Effectiveness, 2014.
[28 ]樊雅琴,王炳皓,王伟,等.深度学习国内研究综述 [].中国远程教育,2015(6) :27 -33.
[29]刘宇,解月光.大学生深层学习的过程研究及思考 [J].中国电化教育,201/(7) :56 -62.
ing deep belief net^vorks from non - stationary streams [ C ]. International Conference on Artificial Neural Networks and Machine Learning. Springer - Verlag, 2012 :379 - 386.
[36 ] [ 39 ] Krizhevsky A,Sutskever I, Hinton G E. Ima- geNet classification with deep convolutional neural networks [C ]. International Conference on Neural Information Processing Systems. Curran Associates Inc. 2012:1097 -1105.
[37 ] Zeiler M D,Fergus R. Visualizing and Understanding Convolutional Networks[J]. 2013,8689:818 -833.
[38] Chen M,Xu Z,Weinberger K, et al. Marginalized Denoising Autoencoders for Domain Adaptation [ J ]. Computer Science, 2012.
[40] Sun Y,Wang X,Tang X. Deep Learning Face Representation from Predicting 10,000 Classes[C]. IEEE Conference on Computer Vision and Pattern Recognition. IEEE,2014 : 1891 -1898.
[41] Wang S,Jiang S. INSTRE: A New Benchmark for Instance - Level Object Retrieval and Recognition [ J ]. Acm Transactions on Multimedia Computing Communications & Applications, 2015,11(3) :37.
[42] 国务院,国务院关于印发新一代人工智能发展划的通知[EB/OL]. [2017 - 07 - 20]. llttp://www. gov. cn/ zhengce/content2017 - 07/20/content_5211996. htm.
[43] 新华社.两会授权发布:政府工作报告[EB/O[2017 - 03 - 16 ]. http://news. xinhuanet. conx/politics/ 20171h/2017 -03/16/c_1120638890_2. htm.
[4]姜强,赵蔚,李松,王朋娇.个性化自适应学习研 究—大数据时代数字化学习的新常态[].中国电化教 育,2016(2) :5 -32.
(本文责任编辑:阎兵)
25
因篇幅问题不能全部显示,请点此查看更多更全内容