摘要:数据挖掘在个性化远程教学系统中的具体应用,使远程教学系统的资源围绕学生的需求来配置,支持学生的个性化学习需要。引入个性化后的远程教育系统是一个智能化的系统,可以更多且及时地了解到学生的学习特征、能力差异、兴趣爱好等,并动态地根据这诸多因素调整教学策略,真正做到因材施教,实现个性化教学。
论文关键词:数据挖掘,远程教学,关联规则,个性挖掘
本文从数据挖掘技术的角度展开对个性化远程教学系统的研究,这里我们需要实现的是针对学习者的数据挖掘,根据对学习者的学习状况、需求、能力差异、兴趣爱好等信息的挖掘,为每位学习者提供不同的学习界面,每个学习者都仿佛找到了一位针对自身特点进行教学的“老师”,充分发挥学习的主动性。在总结了传统远程教学的弊端之后,本文提出了一个基于数据挖掘的个性化远程教学系统。
2.基于数据挖掘的个性化远程教学系统模型的构建
该模型由个性挖掘模块、管理者和教师模块、用户库、资源库、工具库、以及个性化远程教学系统界面组成,各组成主要部分功能描述如下:
2.1个性化挖掘模块
这是整个远程教学系统的枢纽,也是体现个性化的关键。它包括三个部分:学习信息收集、个性化分析中心、信息调度中心。如图所示,信息采集部分利用智能Agent的关键词学习和字典学习方法,自动收集该学习者目前的信息,如学习者必要的个人况、感兴趣的话题、经常搜索的关键字、作业和考试完成情况等,递交到个性化分析心;分析中心取得采集后的数据使用数据挖掘技术进行个性化分析,然后向信息调度块发出命令;信息调度模块再根据发来的命令调度学习工具访问教学资源库,返回相的信息(如某个课件知识点、某张试卷)到用户界面,同时返回个性化分析中心,由析中心将结果数据分析后再写入用户库。这样学生发出的请求得到的是与其有关的个性化的内容,同时随着学习过程的变化,用户库也在不断更新,及时地保存和反映学生前的个性信息。
2.2管理者和教师模块
该模块主要包括管理者Agent和教师Agent。管理者Agent完成对整个远程教学系统的管理工作。教师Agent的操作包括两方面,一是对用户库进行管理,二是对资源库进行管理。
2.3个性化远程教学系统界面
个性界面接受来自学习者的个人信息(登陆信息、个人注册信息等),并将它提供给个性挖掘模块,将返回的结果用于界面重组,使学习者所需求的界面更加容易访问使学习者所关心的超链接更加醒目;为学习者动态推荐网页等。
3 个性化远程教学系统模型系统流程
3.1 模块设计
1.数据收集
这一模块是个性化远程教学平台的基础,其采集数据的类型由个性化远程教育系统的用户分析模块所确立,这是个性分析模块的数据来源,其收集信息的质量与数量将直接影响个性系统分析的质量,采集的基本信息有用户经常访问的地址与栏目,感兴趣的话题、用户的正地址、停留时间、访问的时间频率、经常提问搜索的关键字、作业与考试的完成过程与结果、进行电子讨论的话题、访问的时间段、用户的必要个人信息。信息采集模块负责收集这些信息,并把这些采集的信息顺利的送往下一步的个性分析中心。
2.个性化分析
个性化分析中心有两大基础,第一就是个性信息源,由信息分析采集模块负责。第二就是个性分析的模型。个性分析的模型是一个非常复杂的模型,是对远程教学系统的教和学两个过程和对象特点都做了充分研究的基础上建立的,个性分析中心与个性分析模型的建立是整个个性化服务的关键。个性分析中心有两大主要组成部分:一是用户的信息库,二是分析处理模块。它的工作方式是分析处理模块结合最新采集的信息与信息库中的数据资源进行新的分析,并把这些结果传递到信息返回模块,同时更新用户信息库中的数据。这个过程主要用一些挖掘算法来挖掘出规则、模式等。主要有统计分析、序列模式分析、关联规则、分类、聚类等技术。最为关键以及技术难点在于关联规则和数据的分类与聚类。关联规则是通过分析用户访问网页间的潜在联系而归纳出的一种规则。在远程教学系统中,关联规则可发现用户会话中经常被学生一起访问的页面集,这些页面之间并没有顺序关系,我们可以根据这些学生群的相同兴趣进行教学安排。同时,关联规则还可作为启发规则为远程学生预取可能请求的页面,以减少等待时间,建立起一个方便有效的学习环境。聚类与分类:具有相似浏览模式的用户聚类分成组可用于网络教学环境中,为用户提供推荐链接。分类即将一组组个体分门别类的归入预先设定好的几个类中。可使用决策树,k一最近邻居等算法。在网络教学中,可通过学生填写的个人信息及学生访问行为模式的分析,用分类或聚类方法划分相似学生群体或个体,以提供相似或个性的教学。
3.信息调度
信息返回模块根据个性分析处理后的个性参数来调度几大子系统,并选择合适的教育信息资料并将页面反馈给用户以满足其需求,同时,把用户在子系统中的个性活动信息反馈给个性化分析中心,然后由个性分析中心进行再加工,来更新用户信息库。
3.2 模块的实现
1.人机交互界面
人机交互界面是人机交互的一个模块,通过自然语言处理和语义查询在系统和用户之间提供交互功能。数据挖掘的结果可以从交互界面输出,即可以根据挖掘的结果重组界面。
2.数据收集模块
这一模块是个性化教学的基础,其采集数据的类型由个性化远程教学平台的用户分析模型所确立,这是个性分析引擎的数据来源,其收集信息的质量与数量将直接影响个性系统分析的质量,采集的基本信息有用户的经常访问的地址与栏目,感兴趣的话题、用户的IP地址、停留时间、访问的时间频率、经常提问搜索的关键字、作业与考试的完成过程与结果、进行电子讨论的话题、访问的时间段、用户的必要个人信息。信息采集模块负责收集这些信息,并把这些采集的信息顺利的送往下一步的数据处理模块。
3.数据处理模块
数据仓库中的数据是面向主题的而非面向应用的,数据在进入数据仓库之前必须经过加工与集成。数据仓库中包含了大量的历史数据,且是不可更新的,同时数据仓库中的数据又是随时间变化的,不断增加新的数据、删除旧的数据。数据仓库需要对学生数据进行提取和数据准备,以此显著地加快数据挖掘的速度。
4.数据分析模块(数据挖掘执行系统与数据挖掘规则库)
数据挖掘是核心模块。它对于数据仓库的数据从模型库中提取学生模型和挖掘算法模型进行处理。
4 结束语
数据挖掘技术在远程教学系统中有广泛的应用前景,本文只是从上述几个方面分析了数据挖掘中远程教学系统中的应用,仅仅起到抛砖引玉的作用。随着数据库技术的不断引入,新的特性又分为空间的、时间的、多媒体的数据库。这就决定了远程教学系统中学习者选择数据类型的多样性,同时也对数据挖掘技术提出了新的要求,并给出了新的发展方向,及对各种非结构化数据的挖掘。
参考文献
[1] 李月华.远程教育中数据挖掘技术的应用[J].山西:技术经济与管理研究,2005(1).
[2] ]陈登科,胡翠华.数据挖掘技术在远程教育中的应用[J].长春:情报科学,2003(4)
|