欢迎来到论文网! 识人者智,自知者明,通过生日认识自己! 生日公历:
网站地图 | Tags标签 | RSS
论文网 论文网8200余万篇毕业论文、各种论文格式和论文范文以及9千多种期刊杂志的论文征稿及论文投稿信息,是论文写作、论文投稿和论文发表的论文参考网站,也是科研人员论文检测和发表论文的理想平台。lunwenf@yeah.net。
您当前的位置:首页 > 科技论文 > 计算机论文

数据挖掘技术在校园卡消费系统中的研究

时间:2011-04-24  作者:秩名

论文导读:在本文中,笔者提出构建WEB下基于OLAP和数据挖掘技术的校园卡消费系统的数据挖掘模型,其体系结构如图2所示。本文对用户消费额度进行分析时,采用的数据均取离散值,需对连续值数据进行离散化。在信息输入环节,预先给予统一定义和程度分类,每种程度对应一个分值,按因素状况予以量化,对于数值性因素,给予分段取值。
关键词:数据挖掘,联机事务处理,消费额度,分类

 

0.引言

校园卡消费系统是高校现代化管理的方式,校园卡消费数据涉及到校园消费中的各个方面,例如:就餐、网络费、购物费、淋浴费、洗衣费、娱乐费等等。校园消费卡依托校园网络和银行网络,充分利用IC智能卡的强大功能,全面构建了一个校园卡消费系统[1]。发表论文。虽然系统内有相关的统计分析模块,但对于这些海量的数据信息只能进行简单的分析统计,缺乏有力的数据模型和数据分析手段,对于学校的经营管理还不能做出有效的辅助决策。发表论文。因此本文主要针对校园卡消费系统中各模块数据的特点采用联机事务处理对系统中已有的数据进行分析挖掘,得出一个有效的校园卡消费系统数据挖掘模型,对校园卡消费数据进行有效的分类,并通过分类的结果,分析学生的消费水平,对于高校领导层的决策提供技术支持。

1.联机事务处理的分析与研究

联机分析处理,即OLAP(On-Line Analytical Processing),是一种能使分析者、管理者和领导者快速、一致、交互性的访问企业数据的软件技术,通过OLAP,访问者可以访问从原始数据转化来的反映企业真实维度的各种不同变化形式的信息视图,同原始数据相比,这些视图更易于被使用者理解[1]。

WEB OLAP是随着Internet的发展和网络的普及而产生的,与传统的C/S模式相比,WEBOLAP提供了一种以WEB为基本渠道进行数据交换的方法,这就使得WEB浏览器作为一个使用简单、用户界面友好的信息获取工具被不同计算机水平的用户所接受;并提供了一个与平台无关的信息获取环境。WEB OLAP系统通常由三个部分组成,如图1所示:

图1 WEB OLAP的典型系统架构

2.WEB下基于OLAP的校园卡消费系统数据挖掘模型

由于校园卡消费系统的逐渐实施,校园卡消费系统中保存了大量的学生消费数据,我们所要做的就是利用这些消费数据,并结合学生信息数据,从数据中提取用于制定决策的信息。这种需求既要求联机服务,又涉及大量用于决策的数据,传统的数据库已无法满足这种需求,这主要体现在:

(1)在分析处理环境中,用户的行为模式不同于事务处理,其运行时间长,涉及数据量大,并消耗大量的系统资源;

(2)数据库中一般只存储短期数据,其不同数据的保存期限也不同,即使有些历史数据得以保存,通常也不能得到充分的利用,但对于决策分析而言,历史数据相当重要,许多分析必须以大量的历史数据为依托;

(3)辅助决策信息涉及许多部门的数据,而不同系统的数据很难集成。

以上的这些问题表明,我们需要在数据仓库环境中构建分析型应用。

在本文中,笔者提出构建WEB下基于OLAP和数据挖掘技术的校园卡消费系统的数据挖掘模型,其体系结构如图2所示。

图2 系统结构图

这一模型主要是基于三层浏览器服务器体系结构。基于WEB的系统可以简化应用软件的维护和升级工作,节省相关的成本,让系统的使用更为简单、方便,并能实现基于Internet的自助服务等功能。发表论文。因此,在网络经济快速发展的今天,相对于传统的C/S模式来说,这种基于WEB系统模式能更好的适应企业的需求。

3.校园卡消费系统数据挖掘算法分析

聚类方法可以让使用者在较高的层次上观察数据库,常被用作商业上的客户细分[3]。本文采用聚类分析中的C均值聚类算法,将学生按消费额度归成若干类别。

C均值聚类算法是一种简便实用的无监督学习算法,此算法能够用于已知类数的数据聚类和分类。其基本步骤如下:

(1)选取聚类块数k;

(2)从训练集中任意选定k个向量作为聚类中心;

(3)将每个样本向量(n为输入向量的维数),按下列欧式距离归入中心为的类中。

(4)重新调整聚类中心,令,其中由下式计算得出:

 

 
 

 

(5)如果步骤(4)中的聚类中心不再变化,就终止,否则转步骤(3)。

4.数据挖掘的实现过程

4.1数据预处理

本文对用户消费额度进行分析时,采用的数据均取离散值,需对连续值数据进行离散化。

对于影响消费额度的因素,根据各影响因素的内容和性质予以标准化赋值。在信息输入环节,预先给予统一定义和程度分类,每种程度对应一个分值,按因素状况予以量化,对于数值性因素,给予分段取值。

4.2模型应用

在校园卡消费系统的中,利用预测模型,每月(季度)自动更新学生消费额度的等级的评价,并建立消费额度等级异动(提高或降低1个等级以上)预警设置,以使有关人员及时地了解具体情况,以相应地在管理、政策等方面做出针对性的调整,动态而有效地完善学生消费等级的管理。

查看相关论文专题
加入收藏  打印本文
上一篇论文:神经网络技术探究
下一篇论文:数字监控矩阵
科技论文分类
科技小论文 数学建模论文
数学论文 节能减排论文
数学小论文 低碳生活论文
物理论文 建筑工程论文
网站设计论文 农业论文
图书情报 环境保护论文
计算机论文 化学论文
机电一体化论文 生物论文
网络安全论文 机械论文
水利论文 地质论文
交通论文
相关计算机论文
最新计算机论文
读者推荐的计算机论文