当前,高校数字图书馆个性化服务在一定程度上有所发展,但还存在许多不足之处,主要表现在个性化服务模式单一、在推送上个性化服务缺乏动态性和实效性、推送模式单调等问题。
(二)改进途径
RSS技术是Web2.0中的一种Syndication技术,该技术致力于建立标准的频道描述框架和内容收集机制,主要采用XML的标准。结构化是采用RSS标准格式信息的主要特征,处理和分析该标准的信息非常便利。基于RSS推送技术的动态性、即时性、便捷性的特点可以恰好的填补现有高校数字图书馆个性化服务系统推送方法上的缺陷。
基于现有高校数字图书馆个性化服务系统的不足和RSS技术的优越性,将高校图书馆个性化服务和RSS技术有机结合,在一定程度上实现了用户需求与网站信息的对接,并及时的把最新图书资源主向用户推送,真正的实现了高校数字图书馆个性化服务。
三、高校数字图书馆个性化服务的关键技术探究
高校数字图书馆个性化服务系统的关键技术主要包括用户个性化兴趣、图书使用模型、信息推送三个部分。
(一)个性化服务技术基础
支持个性化服务系统实现的主要技术包括数据挖掘技术、RSS技术等。
1Web数据挖掘
1)Web挖掘的概念和内容
所谓数据挖掘(DataMining)就是从大量的、不完全的、有噪声的、模糊的、随机的原始数据中提取隐含在其中的、事先未知的、但又是潜在有用的信息和知识的过程。依据挖掘对象不同,Web挖掘分为Web内容挖掘(WebContentMining)、Web结构挖掘(WebStructureMining)和Web使用记录挖掘(WebUsageMining)。如图1-1所示。
 
2关联规则算法
关联规则(AssociationRule)是表示数据库中一组对象之间的某种关联关系的规则。
3聚类挖掘
1)聚类的基本概念
聚类是指将物理的或抽象的对象集合分组成为由相似对象组成的多个类的过程。聚类生成的簇是一组数据对象的集合,同一个簇中的对象是相似的,不同簇中的对象是相异的。
2)主要的聚类方法
聚类算法大体上可以分为:分层、划分、基于密度、基于网格的方法等。
3)协同过滤推荐
协同过滤推荐是一种基于聚类技术的推荐算法。常用的协同过滤推荐算法有基于用户的协同过滤推荐、基于模型的协同过滤推荐、基于项目的协同过滤推荐、基于项目评分预测的协同过滤推荐、基于项目分类的协同过滤推荐算法等。
(二)RSS技术
1XML简介
XML(eXtensibleMarkupLanguage)是一种可以对信息进行自我描述的语言。在关系型数据库系统中的应用研究。
XML可看作一种半结构化的数据模型,可以很容易地将XML的文档描述与关系数据库中的属性一一对应起来,实施精确地查询与模型抽取,以检索出适当的数据。通常一个正规格式的XML文档分三部分:一个可选的序言;文档的主体,通常为层次树状结构形式,由一个或多个元素组成;可选的尾部。所有XML文件都包含实体结构和逻辑结构。实体结构包含文件中所使用的实际数据。逻辑结构则像一个样本,说明该文件中包含哪些元素及元素的顺序。
2RSS的概念及标准
1)RSS的概念
RSS是1999年由Netscape发布的,用于发送新闻标题,被称为“推”技术,后来UserlandSoftware发展了其简化版本。与此同时,另外一组开发人员在复兴最初的RDF版本,并最终发布了一个RSS1.0的版本(RichSiteSummary)。RSS是一种用于共享新闻、简讯等Web内容的数据交换规范,是一种基于XML标准的Syndication技术,是广泛应用于互联网上内容封装和投递的协议。
2)RSS的标准
RSS可以将网站当作一系列频道(channels)的集合,每个频道又包括一系列资源(Items),所以通过对频道和资源的描述可以实现对作为资源集合的网站描述。这个采用RSS元素描述的网站内容汇总文件即为一个RSSfeed。
内容提的供者可以为接收者建立一个RSS信息源(RSSFeed),这只需要在其网站中增加些简单的代码。一个RSS文档通常由、、三部分构成。
3RSS信息服务系统解析结构
RSS信息服务方式是内容提供者首先按照内容订阅者的RSS请求把RSSFeed封装,然后把封装后的RSSFeed输出;内容订阅者向RSS聚合器读取RSS摘要且同时获取资讯信息。RSS信息服务系统解析结构包含三个主要部件,如图1-2所示。
图1-2RSS解析体系结构
RSS信息服务使互联网信息的发布和共享变的更方便、更高效,用户可以用更少的时间获取更多的信息。但是这种服务模式缺乏用户的参与,个性化特征不明显。
(三)用户个性化兴趣模型
1用户个性化兴趣模型构架
高校数字图书馆个性化服务系统中用户个性化兴趣模型构架主要包括用户访问信息收集、用户资料收集、用户个性化兴趣提取、用户个性化兴趣更新、用户个性化兴趣表示等。 2/4 首页 上一页 1 2 3 4 下一页 尾页 |