数据,模型,决策分享 http://blog.sciencenet.cn/u/郭崇慧 自强不息,厚德载物

博文

教育数据挖掘——“大数据与智能决策”讨论班

已有 3617 次阅读 2019-11-1 17:45 |个人分类:科研笔记|系统分类:科研笔记

2019年10月8日晚上,“糖果之家”相约星期二,“大数据与智能决策”讨论班(Seminar)继续开讲,本次讨论班以教育数据挖掘与学习分析为题展开讨论,结合实际课题由研究生进行讲解,共有青年教师、博士后、博士生和硕士生17人参加,以下是教育数据挖掘与学习分析的内容简介。

教育数据挖掘与学习分析

教育领域自20世纪80年代开始,经历了教育数字化、网络化和智能化三个发展阶段。随着互联网教育规模的扩大和学生多样化学习的需求的增加,互联网、大数据、人工智能和教育的有机集合成为了顺应时代发展的必然趋势。

image.png

图1  教育数据挖掘与学习分析领域研究热点图

教育大数据是指整个教育活动中所产生的以及根据教育需求采集到的,一切用于教育发展且具有巨大潜在价值的数据集合。教育大数据主要有六大来源:基础统计数据、教学活动数据、教育管理活动数据、科学研究活动数据、服务活动数据以及舆情数据。其中,基础数据包括以人口统计学为代表的教职工与学生的基本信息数据;教学活动数据包括教学过程中涉及的过程、内容和结果数据,比如课堂教学数据、考试测评数据等;教育管理活动数据包括各类教育管理系统中的数据,比如学生学籍数据、学生体检数据和各类统计数据等;科学研究活动数据包括各类科研项目与教育教学实践过程中获得的数据,比如论文发表数据、科研设备数据等;服务活动数据包括学生校园活动数据以及各类服务于教学的系统中的数据,比如餐饮消费、图书馆服务、上机上网服务等;舆情数据包括各种公开媒体中与教育相关的数据,比如各类教育新闻数据等。教育大数据的价值具体表现在教育管理科学化、教学模式改革、学习个性化、教育服务人性化等若干方面。教育大数据正在成为教育领域不可忽视的新型驱动力,在教育教学研究与实践中发挥着越来越重要的作用。

教育大数据分析与挖掘是指综合运用数学、统计学、机器学习和数据挖掘的技术和方法,对教育大数据进行处理和分析,通过数据建模,发现学习者学习结果与学习内容、学习资源和教学行为等变量的相关关系,来预测学习者未来的学习趋势。教育数据挖掘(Education Data Mining,EDM)的发展大致可分为两个时期:第1个时期是20世纪80年代-20世纪末,研究者开始将数据挖掘技术用于教育领域,但研究方法比较简单,研究成果很少。受当时的技术水平的限制,这一时期的数据一般来自于调问卷和信息管理软件,采用的数据挖掘技术主要是统计分析和关联规则算法。第2个时期则是进入21世纪以来,EDM的研究方法与研究成果快速发展,互联网的普及引发了教育技术的变革,这一时期的EDM数据主要来自于开放和智能的线学习系统,采用的数据挖掘技术更加多样化。2012年,美国教育部发布的报告《通过教育数据挖和学习分析促进教与学》标志着EDM 已受到广泛关注。

学习分析(Learning Analytics)是指综合运用信息科学、社会学、计算机科学、心理学和学习科学的理论和方法,通过对广义教育大数据的处理和分析,利用已知模型和方法去回答影响学习者学习的重大问题,评估学习者学习行为,并为学习者提供人为的适应性反馈。

学习分析和教育数据挖掘起源不同,因而有一定的差异。(1)教育数据挖掘侧重开发分析教育数据的方法和技术,而学习分析关注更多的是教学法。(2)教育数据挖掘侧重使用数据,以了解学习如何和何时发生,学习分析则侧重于学习者,利用数据研究学习者与技术的交互如何影响个人学习。(3)教育数据挖掘重视模型算法和关联规则的建立和优化,学习分析则重视基于教学原则的学习过程分析并以此为依据形成评价、生成指导性学习干预,并促进个性化学习。(4)教育数据挖掘通过严格的规则进行数据挖掘,注重比较不同的建模方法,发现模型和结构的合理性,这些规则和方法为学习分析提供鉴;学习分析收集学习者留下的痕迹,并利用这些痕迹来提高学习,教育数据挖掘是处理这些痕迹的算法并指出趋势或计算指标。

目前针对互联网教育大数据的学习分析研究主要是从2012年开始的,而从2015年开始转向学习分析的实证研究和应用研究。但研究的主要对象是学生,研究的内容集中以下几个方面:

(1)学习者行为分析与预测

通过学习者在慕课平台上产生和积累的行为数据,量化其行为特征,从而对其学习行为进行预测和分析。主要采用的方法为回归分析和迁移学习。

(2)学习者学习效果分析与预测

旨在研究学习者通过何种学习过程达到了何种学习效果,从而建立起学习过程与学习效果的关系。主要采用的方法为区间估计方法与支持向量机的结合,以及协同过滤算法。

(3)平台供应商数据分析

使用慕课平台供应商积累的数据进行全局分析。旨在利用这些数据改善平台供应商提供的服务。


    








https://blog.sciencenet.cn/blog-34250-1204413.html

上一篇:事件抽取——“大数据与智能决策”讨论班
下一篇:意见挖掘——“大数据与智能决策”讨论班
收藏 IP: 202.118.103.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-25 14:30

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部