研究文章|开放访问
梁坤,张益英,何业申,周宜林,谭伟,李晓霞, "基于在线行为分析的智能E-Learning学生档案",电子与计算机工程学报, 卷。2017年, 文章的ID9720396, 7 页面, 2017年. https://doi.org/10.1155/2017/9720396
基于在线行为分析的智能E-Learning学生档案
抽象的
随着移动平台的开发,如智能手机和垫,电子学习模型已被迅速发展。然而,由于电子学习平台的完成率低,因此很有必要分析在线学习者的行为特征,以智能地调整在线教育战略,提高学习质量。在本文中,我们分析了电子学习的关系指标,以建立学生档案并得到对策。采用相似性计算和Jaccard系数算法,我们设计了一个系统模型,以清洁和挖掘教育数据以及学生的学习态度以及学习行为的持续时间来建立学生概况。根据电子学习资源和学习者行为,我们还提供了智能指南模型,以指导电子学习平台和学习者来改善学习。对学生档案的研究可以帮助电子学习平台满足并引导学生的学习行为,也可以提供个性化的学习情况,并促进电子学习的优化。
1.介绍
作为教育的有效途径,电子学习支持更多的知识和技能,而不是传统教育,并且超出了基于新信息和通信技术的时间和空间的限制[1].MOOC(大规模开放的在线课程)是代表在线教育平台。Coursera是世界上最大的MoOC平台,由美国顶级大学网络学习平台建立。目前,在平台上有大约1563个课程和超过1700万人注册的学生。基于EDX,最大的MOOC平台(http://www.xuetangx.com.)由清华大学在中国开发。它拥有大约200多个国家和地区的300万会员[2].
电子学习教育迅速发展。数字1表明,2015年中国电子学习用户的数量达到了90.992亿,年增长率为56%;到2017年将增长到120万人。
但是,虽然越来越多的人担心电子学习平台,但只有7%-9%的学习者根据Coursera统计数据完成了MooC课程[3.].因此,有必要提高学习质量,并优化教学机制准确推动课程。学生档案是分析基本信息的新方法,并学习在线学习者的行为。通过建立学生档案,它是实现个性化的情况建设和学习过程指导,在促进在线学习方面发挥着积极作用。
学生档案是一种基于大数据和标签的人物肖像分析。我们收集、处理和分析学习者行为中产生的数据,用于对单个学生或群体的信息描述。根据行为心理学的理论,利用学生概况对学生行为数据进行分析,可以反映学生的行为特征和心理动力学。例如,电子科技大学教育大数据研究所与其他部门合作开发了学生档案系统,该系统可以在考试不及格时给出预警[4].同样,西南交通大学收集并分析了校园“行为轨道”模型的大数据绘制了学生,以预测学生的未来发展[5].在国外,研究人员已经证明,利用大数据分析学生在线阅读课程信息、提交作业、交流等学习行为,可以检测出学习成绩差的警告信息。教师根据这些警告信息提出改进建议,并给予一定的指导,以确保学生有效学习。然而,“学生概况”已经应用于教育领域;大数据档案技术与教育相结合具有非常重要的现实意义。
鉴于电子学习数据,我们使用大数据技术来分析电子学习特征,本文的主要研究内容如下:()分析影响学生形象的因素。根据年龄对学生进行分类,定义学生行为与学时的关系;()构建学生档案模型。我们收集和预处理的数据并通过Jaccard算法挖掘了学生的学习行为属性的连接,最后形成学生档案;()分析学生档案。有助于E-Learning平台更好地了解学生的学习行为。
2.学生概要文件的定义
学生档案描述了来自多体和多端的学习特征。它包括分析指标和影响因素,如学生行为,数据收集,数据清洁和学生简介建设和分析[6].
2.1。学生定义
学生档案的主要研究是学校或电子学习平台的学生。假设学生设置如下: 在哪里表示按年龄归类的学生;意味着个人;表示学生年龄级别(为方便起见,通常省略上标),按年龄分为17岁以下、18-24岁、25-34岁、35-54岁、55岁以上5类,如表所示1.
|
根据年龄,我们可以预测学习者简介信息并进一步挖掘学生学习的特征。
2.2。学习行为的定义
在线学习行为是网络环境下的学习行为。我们专注于挖掘学习者在线学习行为的特征,以了解学生的表现。学习行为的核心是在线学习行为的运作[7,8].例如,学习者点击课程,浏览页面,播放视频,下载相关的课件。“点击”和“下载”是关于学习行为的两个操作。学生概要文件中的行为集(行为)定义为 在哪里表示行为品种,包括12种学习行为,如学习目标,文本学习,在线练习和制作笔记,如表所示2.
|
由于在线学习是在线学习行为的时间流程,因此评估在线学习质量的重要参数。特别是,它反映了对学习的关注程度。学生配置文件中的持续时间集(时隙)定义如下: 在哪里表示各种持续时间;分为1-10分钟、10-20分钟、20-30分钟、30-40分钟、40-50分钟、50-60分钟等时间段。
根据上述定义,是指行为的学生.我们假设行为差异;它代表了某种行为的学生的差异。例如,假设大学学习者,工作学习者,以及在线培训.我们采用分析大学生与职场学习者在网络培训行为上的差异。
3.学生档案模型
学生档案有一个完整的模型,以指导我们分析学生的在线学习过程。学生档案模型(图2)包括数据收集、数据清理和纵向分析。首先,数据收集可以通过E-Learning平台或问卷调查的方式获得原始数据。其次,利用属性约简对原始数据进行清理,然后利用Jaccard系数算法进行数据分析和数据挖掘。最后,根据分析结果对学生进行标签,形成学生档案。同时,我们建立了知识库(KB)来存储关于学生概况的知识表[9].在学生档案模型中,知识库并行于数据挖掘层和交互层。从知识库中,我们提取一些学生概要集来深入研究、分析并将结果存储在知识库中。因此,学生档案知识库具有自我成长和自我完善的能力。
3.1。数据采集
数据采集包括四个类别,例如学生用户注册数据,Web日志数据,学习行为数据以及学习内容偏好数据。学生用户注册数据主要分析了学习者的特征,包括用户名,性别,出生日期,地理,职业和爱好。Web日志数据反映了电子学习平台的操作,包括活动号,页面视图,访问时间,激活率和学习路径。学习行为数据有助于对在线学习绩效的统计分析,包括学习时间,学习活动,学习资源和检查结果。学习内容偏好数据可用于分析课程或教师的偏好,包括浏览/收集内容,审查内容和交互式内容。准确推动课程有助于推动课程。
3.2。数据清洁
数据清洁预处理原始数据,删除冗余数据,保留分析的有用数据,并将数据组织成标准格式。因为异常值的干扰通常会导致数据挖掘失真[10.- - - - - -12.]数据清洁提高了数据分析的准确性,并确保了数据挖掘的可靠性。
属性归纳是收集数据源预处理的最重要过程。假设原始数据字段到,在那里是原始数据字段的维度。设置矢量,在那里和意味着理想的财产。通过数据预处理的属性规范来提供所有所需属性,属性归纳方法定义为SIG,清理数据以获取以下结果:
其中是维度数据字段的一个重要属性。在我们的解决方案中,我们计算属性的重要性,并选择与所需属性相关的相同行为分析。我们的解决方案不处理关于团体的属性归纳的具体实现。
4.学生简介分析
在本节中,我们计算不同学生的行为集中的相似度,通过Jaccard系数相似度算法将学习者的在线行为特征和持续时间进行比较,将相似属性划分为一个类,将不同属性划分为不同类。
4.1。学生行为具有相似性计算
不同学生对象的行为特征的相似性属于非数字对象;我们采用Jaccard系数计算相似度[13.,14.].相似公式为: 在哪里和代表的行为学生的和.假设学生属于KB;我们比较到.如果和相似性差异太大,它将被添加到KB作为新类。
用户相似性被定义为
其中表示学生之间的相似性和;表示学生集的行为维度属性;表示属性的相似性学生之间和, 和.
根据相似性计算,我们获得如下:
它是一个上三角矩阵,表示线和行,是学生之间行为特征的相似性和学生.
描述Jaccard系数算法如算法所示1.
|
根据雅卡尔系数算法的结果,对学习者进行标记。假设从学习行为和持续时间两个维度进行计算。如果学习时间超过60分钟,就会被称为“深度学习型”。同样的,如果学生的学习时间少于10分钟,那么他就会被贴上“品味型”的标签。此外,根据在线问题和在线培训的频率,我们将其分为“好奇型”、“应用型”和“坚持型”。具体的标注方法不在这里重复。我们只针对读者提出了雅卡尔系数算法和标注思想。
4.2.学习态度分析
学生的学习态度有与学习效果有所不同。我们收集了18-24岁的学生组的数据,并在统计上分析了它,例如有明确的学习目标以及是否具有学习计划。如图所示3.,反映了学习者对E-Learning课程的主观能动性和认可度,有助于分析E-Learning的干扰因素。
在18-24岁的群体中,有大约94.3%的学习者,他们认为电子学习课程对他们有帮助。有18.47%的学习者有明确的学习目标,58.6%的学习者偶尔有明确的学习目标。这种比率反映了大多数学生都盲目地接受了电子学习课程。有45.9%的学习者没有学习计划,55.73%的学习者在做其他事情时在线学习,例如QQ聊天和听音乐。根据图3., E-Learning课程要求学习者具有明确的目标、内在动机、同步反馈和独立性。由于网络学习者对网络课程的认可度很高,E-Learning平台的发展前景更加广阔。
4.3.在线学习行为持续时间分析
在线学习者的学习行为是多样性的。在一定程度上,学习行为的频率反映了学习者对学习资源的关注。根据频率统计[15.,我们分析了哪些课程资源更容易被学习者接受,如图所示4.
在图中4,行为1-7是一个独立的学习行为。行为8-11是一种互动学习行为。行为11-12与学习无关。大多数学习者浏览文本并经常制作笔记;因此,文本资源是最受欢迎的资源类型。大约90%的学习者将首先浏览多媒体资源。只有50%的学习者将参加在线练习,只有1-5次。大约60%的学习者将选择在学习课程之前查看学习目标,并且视图的数量通常小于5次。80%的学习者将休息;听音乐; or QQ chat 1–5 times during the learning process. This shows that most learners have a sense of learning strategies. They are interested in multimedia resources, but they are more used to learning through reading text resources. Online interactive learning behavior is low [16.,17.].在网络中学习容易引起疲劳,受聊天等因素的影响。
4.4。智能学习指南
4.4.1。成就预测
MooC是一个受欢迎的电子学习平台,其重要性反映在课程的通过率。鉴于MOOC的低通率[15.,18.,则假设课程是根据学习者的行为特征来预测学习者最终是否能获得证书。我们也试图验证之前的分析和结论。
我们假设行为数据来自于前5-7周在数据结构和算法分析(DSAA)课程上注册的学习者。对数据记录中未注册学习者的行为进行过滤后,样本统计如表所示3..
|
定义每个课程学习者和每一个学习者都有特征值
预测价值是
其中表示课程;意味着它不太可能获得证书,而且意味着你可能会拿到证书;和是一个预测函数。
我们选择了课程的特征值,它们对学习者的学习效果有很大的影响。从表2,它们是文本学习行为的数量(),多媒体学习行为的数量(),网络实践行为数量(),下载课件行为的数量(),以及在线问题行为的数量()。
根据本课程,数据集分为训练集,验证集和随机测试;该比率为3:1:1。要使用培训参数与每个实验设置训练集,请选择验证集的最佳参数,然后使用测试集来计算指示符。我们使用了三种分类模型:线性判别分析(LDA),Logistic回归(LR)和线性支持向量机(LSVM)。它们用于预测过程,实验结果如表所示4.
|
实验结果表明,三种分类器显示了一致的性能,精度更高。数字5显示了DSAA过程预测的F-core的时间序列变化。根据学习者上半学期的学习行为,准确预测最终的学习结果,是否能获得证书[2].事实上,如果一个学习者在前半学期表现良好,这表明他是坚定的和有能力的。他比其他人更有可能最终拿到证书。
4.4.2。情绪指南分析
成就预测可以帮助电子学习平台发现异常情况,以便及时干预和指导学生。因为在线学习者主要是独立的学习者,他们孤立并缺乏情感沟通,这使得它们缺乏情感支持,并且难以保持长期学习热情[19.].通过在学生概况中构建智能学习指导机制并为学习过程提供一些情感帮助和支持服务来解决情绪缺陷是一种有效的方法[20.].
根据E-Learning资源和学习者的行为,我们可以提出一个由持续时间、访问频率、注意力等参数支持的学习者情绪评价模型,如图所示6.
结论
在本文中,我们深入研究在线学习行为,并通过大数据处理技术构建学生档案。首先,我们分析了学习者的特征和影响学习行为的因素,并使用属性减少方法来清理数据。然后,我们计算学生行为的相似性,并使用Jaccard系数算法对学生进行分类。最后,已经建立了学生简介以及视觉分析。我们确认电子学习课程需要明确的目标,内心动机,同步反馈和学习者的独立性。学生档案可以帮助学生了解他们的学习情况,找到自己的问题,并提高在线课程的完成率。随着教育数据的持续积累和深入发展,学生档案必然会促进电子学习的健康发展。未来,我们将对在线知识聚合的碎片进行深入研究。
利益冲突
提交人声明有关本文的出版物没有利益冲突。
致谢
天津科技大学青年创新基金资助项目(no. 5130429);2016 lg28)。
参考
- T.-h.王某,“开发以评估为中心的电子学习系统,提高学生学习效果”计算机与教育,卷。73,pp.189-203,2014。查看在:出版商网站|谷歌学术搜索
- “基于MOOC数据的学习行为分析与预测”,《中国科学(d版)》,计算机研究与发展杂志号,第52卷。3, pp. 614-628, 2015。查看在:出版商网站|谷歌学术搜索
- 王敏,王志强。陈金硕,J. M. Spector,“2000-2012年工作场所电子学习研究:文献计量学分析”,教育研究审查,卷。11,pp。56-72,2014。查看在:出版商网站|谷歌学术搜索
- M. Raspovic和A. Jankulovic,“使用学生满意分析的电子学习绩效测量”信息系统前沿,pp.1-12,2016。查看在:出版商网站|谷歌学术搜索
- C. G. Brinton,S. Buccapatnam,M. Chiang和H. V.V.Pil,“MooC MooC点击流程:关于学习者行为与性能之间的关系:计算机科学”https://arxiv.org/abs/1503.06489.查看在:谷歌学术搜索
- T. Sinha,“你的咔哒决定你的命运:利用MooC视频的棉絮模式推断学生的信息处理和消耗行为,”https://arxiv.org/abs/1407.7143.查看在:谷歌学术搜索
- 刘颖,“元认知策略与网络学习行为及成绩关系的实证研究”,作者:王莹,中国语言教学与研究,卷。2,不。1,pp。990-992,2011。查看在:出版商网站|谷歌学术搜索
- S. Dumais, R. Jeffries, D. M. Russell等人,“通过日志数据和分析理解用户行为”在HCI中了解的方式,第349-372页,施普林格,纽约,纽约,美国,2014。查看在:谷歌学术搜索
- I. Jo, T. Yu, H. Lee,和Y. Kim,“高等教育中学生在线学习行为与学术成就的关系:学习分析方法”,刊于智能学习中的新兴问题,教育技术讲义,PP。,PP。275-287,Springer,柏林,德国,2015年。查看在:出版商网站|谷歌学术搜索
- I. H. Witten和E. Frank,数据挖掘:具有Java实现的实用机器学习工具和技术,第13卷,第2期Morgan Kaufmann, Burlington, Mass, USA, 2011。
- D. Agrawal,C. Budak,A.El Abbadi,T.Georgiou和X. Yan,在线社交网络中的大数据:用户交互分析在社交网络中建模用户行为,“网络信息系统中的数据库,卷。8381的计算机科学讲义,pp.1-16,Springer International Publishing,2014。查看在:出版商网站|谷歌学术搜索
- Y.AR和E.Bostanci,“对协作过滤问题的遗传算法解决方案”,专家系统与应用,卷。61,pp。122-128,2016。查看在:谷歌学术搜索
- J. Santisteban和J. Tejada-Cárcamo,“NLP的单侧加权Jaccard系数”第14届墨西哥人工智能国际会议的诉讼程序(Micai'15),pp.14-20,IEEE,Cuernavaca,墨西哥,2015年10月。查看在:出版商网站|谷歌学术搜索
- X. xian,F. Chen和J. Wang,“深入了解校园网络用户行为分析决策系统”第二届计算机、消费者与控制国际研讨会论文集(IS3C’14),pp.537-540,台湾台湾,2014年6月。查看在:出版商网站|谷歌学术搜索
- H. Khalil和M. Ebner,“‘你对你的MOOC课程有多满意?这是一项关于大型在线课程互动的研究。”新闻和大众沟通季刊,卷。5,不。12,pp。629-639,2016。查看在:出版商网站|谷歌学术搜索
- D. Hempel,S. Sinnathurai,S. Haunhorst等,“基于案例的电子学习对学生表现的影响,在关怀的超声课程中:随机试验”欧洲急诊医学杂志,卷。23,不。4,pp。298-304,2016。查看在:出版商网站|谷歌学术搜索
- D. D. D.事先,J.Mazanov,D. Meacheam,G. Heaslip和J. Hanson,“态度,数字识字和自我效力:在线学习行为的流动影响”互联网和高等教育,卷。29,pp。91-97,2016。查看在:出版商网站|谷歌学术搜索
- L. Geoffrey,从电子阅读到电子学习:一个在线学习的教学框架,2016年。
- 黄,学习者情感建模研究及其在电子学习中的应用,中国中南师范大学,武汉,2014年。
- S. Bhuta, A. Doshi, U. Doshi,和M. Narvekar,“推特数据情感分析技术综述”智能计算技术问题和挑战国际会议的诉讼程序(ICICT'14),pp.583-591,IEEE,Ghaziabad,印度,2014年2月。查看在:出版商网站|谷歌学术搜索
版权
版权所有©2017 KUN LIANG等。这是分布下的开放式访问文章知识共享署名许可协议如果正确引用了原始工作,则允许在任何媒体中的不受限制使用,分发和再现。