欢迎来到论文网! 识人者智,自知者明,通过生日认识自己! 生日公历:
网站地图 | Tags标签 | RSS
论文网 论文网8200余万篇毕业论文、各种论文格式和论文范文以及9千多种期刊杂志的论文征稿及论文投稿信息,是论文写作、论文投稿和论文发表的论文参考网站,也是科研人员论文检测和发表论文的理想平台。lunwenf@yeah.net。
您当前的位置:首页 > 科技论文 > 计算机论文

浅谈数据仓库技术

时间:2011-04-23  作者:秩名

论文导读:数据仓库的英文名称为DataWarehouse,简写DW。从数据仓库的概念上我们可以从两个方面理解,一方面,数据仓库是用来支持决策的,主要面向分析型数据处理,这一点有别于企业现有的操作型数据库。
关键词:数据库,数据仓库,数据处理
 

1.数据仓库的定义

数据仓库的英文名称为Data Warehouse,简写DW。W.H.Inmon。我们把它的定义为:数据仓库是一个数据 集合,它的特点是:用于支持管理决策时它是面向主题的,集成的,相对稳定的,能够反映历史变化的。从数据仓库的概念上我们可以从两个方面理解,一方面,数据仓库是用来支持决策的,主要面向分析 型数据处理,这一点有别于企业现有的操作型数据库;另一方面,数据仓库对多个异构的数据源进行有效集成,在集成后又按照主题重新进行了组合,并且包含历史数据,尽管如此,却一般不再修改其存放在数据仓库里的数据。

2.数据仓库的特点

(1)面向主题。操作型数据库的数据组织面向事务处理任务,各个业务系统

之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织,一个主题通常与多个操作型信息系统相关。论文发表

(2)集成的。面向事务处理的操作型数据库通常与某些特定的应用相关,数

据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须保证数据仓库内的信息是关于整个企业的一致的全局信息。

(3)相对稳定的。操作型数据库中的数据通常实时更新,数据根据需要及时

发生变化。数据仓库的数据主要供企业决策分析只用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库之后,一般情况下将被长期保留,修改和删除操作很少,通常只需要定期的加载、刷新。论文发表。

(4)反映历史变化。操作型数据库主要关心当前某一个时间段内的数据,而

数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点到目前的各个阶段的信息,以对企业的发展历程和未来趋势做出定量分析和预测。

3.数据仓库的结构

如上图所示,整个数据仓库系统包含五个层次:

(1)数据源层。是数据仓库系统的基础,是整个系统的数据源泉。通常包括企业内部信息和外部信息。论文发表。

(2)数据导入层。是数据在进入数据仓库前的一个临时存放区,通过数据调度工具将业务系统传送过来的数据表、文本文件等加载到临时存放区。

(3)数据服务层。是整个数据仓库系统的核心。针对现有各业务系统的数据,进行抽取、清理,并有效集成,按照主题进行组织。数据仓库按照数据的覆盖范围可以分为企业级数据仓库和部门级数据仓库(通常称为数据集市)。

(4)应用服务层。应用服务层的功能主要是建立多维数据集、进行OLAP分析、生成各种静态报表并以WEB方式提供各种功能的查询分析。

(5)用户层。根据对数据仓库需求的不同,数据仓库的用户可以分为普通用户、技术用户、高级管理用户这三类。不同用户对数据仓库访问的需求层次以及复杂度都是不同的,简单的需求是访问一些固定的静态报表和查询分析,复杂的可以通过前端展现的工具生产一些灵活、动态的即席查询报表,以满足业务部门一些临时的、迫切的报表需求。

4.相关的网站和论坛:

(1)数据仓库之路 www.dwway.com/html/news.html

(2)MyDWBIhttp://www.mydwbi.com致力于打造最专业的中文数据仓库,商务智能社区

(3)商业智能和数据仓库爱好者http://www.bihuman.com/

(4)数据挖掘研究院 http://www.chinakdd.com/

5.研究和商业机构

(1) 北京大学移动通信数据仓库联合实验室

2006年5月由中国移动、北京大学、亚信集团联合建立,该实验室”是全球容量最大的数据仓库分析系统实验室,也有效的整合了三方得优势资源。中国移动通信目前构建了目前国际上最大的数据仓库系统,联合实验室的建立,既能推动中国移动自身数据仓库系统建设,也能明显推动数据仓库技术向纵深发展。

(2)中国人民大学数据仓库和商务智能实验室

2004年5月由中国人民大学和全球著名的数据仓库厂商NCRTeradata联合建立。该实验室承担了国家863计划、国家自然科学基金重点项目、教育部重点项目等国家重大科研任务。借助于NCRTeradata的优势技术,双方将通过密切的合作,共同开发具有中国行业特色的数据仓库和商务智能应用软件。

(3)北京汉端科技有限公司

北京汉端公司是一家专门从事商业智能信息化服务的企业,从1996年就开始专业做数据仓库,它在数据仓库领域是相当专业的,在这可以接触到最前沿的数据仓库技术。

(4)上证所金融创新实验室

2006由上海证券交易所成立,该实验室的数据全部来源于数据仓库系统。 上证所在推出金融新产品时,都曾通过数据仓库平台进行过测算和验证。通过实时数据仓库技术,为上证所的经营、监管、创新和服务决策提供数据支持,极大的提高了监管的效率和服务的性能,能够更好地服务市场和监管市场。


参考文献:
1伍小荣 伍庆华 数据仓库技术的研究现状和未来方向 [期刊论文] 现代电子技术2002(6)
2.向海华 数据库技术发展综述[期刊论文] 现代情报 2003(12)
3.王泽明浅谈数据仓库技术 [期刊论文] 计算机应用与软件2001-01-15
4.黄庆普 剖析数据仓库技术 [期刊论文] 华南金融电脑2003年11期
5.刘立波 数据仓库技术的研究与应用[期刊论文] 计算机工程与应用2002(15)
 

 

查看相关论文专题
加入收藏  打印本文
上一篇论文:浅谈扫描仪的使用
下一篇论文:浅谈网络安全的技术与管理
科技论文分类
科技小论文 数学建模论文
数学论文 节能减排论文
数学小论文 低碳生活论文
物理论文 建筑工程论文
网站设计论文 农业论文
图书情报 环境保护论文
计算机论文 化学论文
机电一体化论文 生物论文
网络安全论文 机械论文
水利论文 地质论文
交通论文
相关计算机论文
最新计算机论文
读者推荐的计算机论文