欢迎来到论文网! 识人者智,自知者明,通过生日认识自己! 生日公历:
网站地图 | Tags标签 | RSS
论文网 论文网8200余万篇毕业论文、各种论文格式和论文范文以及9千多种期刊杂志的论文征稿及论文投稿信息,是论文写作、论文投稿和论文发表的论文参考网站,也是科研人员论文检测和发表论文的理想平台。lunwenf@yeah.net。
您当前的位置:首页 > 科技论文 > 图书情报

我国元数据研究述略

时间:2011-04-22  作者:秩名

论文导读:关于元数据研究,目前已经成为国内图书馆学情报学研究的前沿和热点。
关键词:图书馆,网络信息资源,编目信息资源,组织
 

关于元数据研究,目前已经成为国内图书馆学情报学研究的前沿和热点。据不完全统计,2000—2006年,在专业刊物上发表的涉及这一领域的研究性文章多达300篇,其研究广度和深度都是前所未有的。这里只能择其要者并概括为3个方面,略述如下。

1 元数据理论研究

1.1 元数据体系

电子信息资源的元数据通常很难独立于一个完整的元数据体系之外,也就是说,为了使计算机能够理解并进行操作,元数据必须存在于一个元数据体系之中。一个元数据体系要规定元数据的三个方面:语义、描述规则和语法。语义是指元数据元素本身的意义;描述规则是对元素赋值方法的确定,即指描述元素时所采用的标准、最佳实践或自定义的描述要求;语法规定了元素怎样以机器可读的方式给予编码。从逻辑上说,以上三个要素都具备才能构成一个完整的元数据体系。

1.2 元数据类型

常用的元数据可分为管理型元数据、描述型元数据、保存型元数据、技术型元数据和使用型元数据五种类型。其中管理型元数据是用来管理与支配信息资源的元数据,描述型元数据是用来描述与识别信息资源的元数据,保存型元数据是与信息资源保存管理有关的元数据,技术型元数据是与系统或元数据怎样运行有关的元数据,使用型元数据是与信息资源用户层次和类型有关的元数据。

1.3 元数据格式

常见元数据格式有四种,研究者们对其原理和应用进行了深入思考:⑴MARC。论文参考网。MARC即机读目录格式,是世界各国图书馆馆藏信息资源的主要表示格式,它提供了一整套完整、详尽、复杂的流式数据表示规范。它是图书馆描述、存储、交换、处理以及检索信息的基础。⑵DC。DC简称为都柏林核心,具有简练、易于理解、可扩展、能与其他元数据格式进行桥接等特性,这些优点使他成为了一个良好的网络信息资源描述的元数据格式。⑶XML。XML是可扩展置标语言,是一种基于SGML的简单灵活的语言。XML本身不仅仅是一个标记语言,还是一个元语言。⑷RDF。RDF即资源描述框架,是一个使用XML语法来表示的资料模型,用来描述Web资源的特性,及资源与资源之间的关系。它是为试图解决许多元数据的互操作性和兼容性而制定出来的,为元数据在Web上的各种应用提供一个基础结构,以促进网络资源的自动化处理[1]。

1.4 元数据结构

对于一个元数据格式来说,它由多层次结构组成:⑴内容结构(Content Structure),对该元数据的构成元素及其定义标准进行描述。例如,一个元数据的构成元素可能根据其目的而包括信息内容描述性元素、技术性元素、管理性元素、结构性元素,元数据内容结构需要对所采用的元素进行准确定义和描述。⑵句法结构(Syntax Structure),定义元数据结构以及如何描述这种结构,例如元素的分区分段组织、元素选取使用规则、元素描述方法、结构语句描述语言等。⑶语义结构(Semantic Structure),定义元数据元素的具体描述方法,尤其是定义描述时所采用的标准、最佳实践或自定义的描述要求[2]。

1.5 元数据登记站

元数据登记站的目的就是收集有关元数据格式方面的数据,通过促进元数据的发现和重用,推动其跨学科和团体的广泛使用,加速元数据的标准化和互操作性。元数据登记站的基本组成部分包括数据模式、元素、元素集、编码格式和应用框架。除了这些共同的组成以外,每个登记站都有自己的特定规模,基本可以分为四类:⑴跨学科和跨格式登记站;⑵特定领域跨格式登记站;⑶特定项目登记站;⑷特定格式登记站。

2 元数据应用研究

2.1 应用于不同领域的元数据格式

1990年以来,许多元数据格式在各个不同领域出现,它们分别是:⑴网络资源。Dubie Core、ROADS Template、CDF、Web;⑵文献资料。MARC、Dublic;⑶人文科学。TEI Header;⑷社会科学数据集。ICPSR SGML Codebook;⑸博物馆与艺术作品。CIMI、CDWA、RLG REACHElement;⑹视觉资料。VRA Core Categories for Visual Resources;⑺音乐资料。SMDL;⑻政府信息。CILS;⑼地理空间信息。FGDC/CSDGM;⑽数字图像。MOA2 medata、CDL medata、Open Archives Format、VRA Core、NISO/CLIR/RLG TechnicalMetadata forImages;⑾美国机读目录格式.US Machine-Readable Catalogingformat,USMARC;⑿都柏林核心数据。Dublin Core。

2.2 具体应用领域

2.2.1 在网络信息资源组织中的应用

在元数据XML和DC结合应用下产生的推技术主要是网上信息自动搜寻和依据用户需求进行的一系列加工组织与管理。推技术可以充分表达用户的信息需求,是真正意义上的面向用户、面向主题的。在实际应用中为用户提供了相当大程度上的方便[3]。另外,push与pull有机结合,可采用先推后拉、先拉后推、推中有拉、拉中有推等方式,为用户提供及时、针对性强的服务。

语义网是元数据在网络信息资源组织中的综合应用。主要是应用XML和RDF结合Ontology构建语义网,使网页文档的语义能清晰地体现出来,并为检索程序所理解,进而实现对网络信息资源组织的目的[4]。

2.2.2 在学术资源组织中的应用

元数据在学术资源组织中的应用体现在两个方面:⑴元数据在期刊信息组织中的应用。元数据可用于期刊收集、版权与级别、排架信息、数字化标准选择中;可通过记录编目、寻找帮助、主题索引、资源链接、责任者注释等来描述与识别信息资源;可依据期刊实体条件,记录期刊信息资源物理复制和数字更新的行为等来保存信息;可用硬件和软件、数字化信息的格式、缩放比率、系统反应次数追综、密码、口令等表述系统技术运行情况;可通过用户记录、用户使用跟踪、知识再利用等进行用户分析和使用跟踪[5]。⑵元数据在网络学术资源组织中的应用。网络学术资源组织分为网络学术资源相关站点的链接、网络学术资源学科导航系统的建立、建设各学科专业信息网三个层次。目前国内外大都用DC的某些著录项对第一层次进行组织;DC在第二层次的组织中被用于定义学科导航著录字段,DC元素修饰词被用于规范学科导航记录字段、描述学科导航资源[6];DC在第三层次组织中的应用还未开展 ,有待于今后探讨。

2.2.3 在教育资源发现中的应用

教育资源是在学习过程中被使用或参考的一个实体。教育资源包括用于教学过程及其评价、管理的教材、课件、辅导资料、参考资料、习题集、试题集、工具型资料、教学标准与过程规范等。在教育资源中创建元数据将促进教育资源的发现,教育元数据将通过准确描述教育资源,定位和区分不同类型资源,依据相关性准则发现并给出定位信息。教育资源的特殊性使元数据的应用大大提高了其资源发现的能力[7]。

3 元数据互操作研究

3.1 元数据互操作协议

实现元数据的互操作必须定义一个公认、彼此遵循的协议。协议能够满足互操作的需要,同时应该允许用户在协议范围内,建立满足自己特殊要求的元数据标准。在这个范围内产生的元数据标准,应该在可以访问别的数据库的同时也可以被别的数据库访问。目前国际上存在的OAI和Z39.50等协议正是为解决元数据互操作问题而提出的,并取得了一定的进展[8]。

3.2 元数据互操作方案分析

元数据的互操作是元数据研究领域的核心问题。研究者们在近两年的研究中针对元数据互操作问题提出了许多解决方法:一种观点认为,元数据互操作作为分布环境下数字信息服务的关键技术,已有多种互相支持的技术得到深入研究和初步应用,其中包括元数据转换、RDF/XML、元数据开放搜寻、元数据复用等方案,分别从语义、语法、结构等方面解决多元化元数据的互操作问题。其中,语义是元数据互操作的本质,语法是表现形式,结构是描述框架。这三方面被视为解决元数据互操作的技术途径[9]。另一种观点认为,解决元数据互操作性问题的一种方法是进行元数据格式转换,被称为元数据映射。从理论上将,作为一个描述性系统,元数据应该允许系统间的描述性映射。如果不同系统能够允许在元数据间创建映射,那么每一个系统都可以查找其他系统的元数据,如果所有系统都创建了通用的映射,那么就可以实现跨系统的广泛检索。目前已经创建了许多映射方式:①一对一的映射方式;②映射XYZ方式;③映射X方式[10]。

3.3 影响元数据互操作的障碍分析

元数据的差别会引起检索的困难,元数据的差异越大,检索方面存在的问题就越多,主要包括以下几个方面:⑴语义差别。在不同的元数据体系间,没有绝对的对应关系。论文参考网。有时是元数据语义不同,有时则根本没有可对应的元数据。⑵使用中的差别。不同的组织有不同的描述习惯,图书馆、档案馆或博物馆的元数据,即使是最基本的元素都不相同。⑶描述方法的差别。即使元素定义完全相同,如果描述规则不同,数据也会以不同形式记录。⑷词汇的差别。当用户希望从不同主题领域或类型的机构检索元数据时,词汇不相容是一个共同的问题。⑸款目与集合。论文参考网。当用户试图将描述单一物体的元数据与EAD或其他复杂的多层次描述体系相结合时,会出现一些特别的问题。⑹多版本。不同的版本会引出一些复杂的差异。一个常见的问题是由作品二次处理时使用不同的加工处理方法所引起的。⑺多语言。网络是多语言的。传统的方法是使用控制词表及多语言的序词表。多语言的元数据登记可能也需要在不同的元素名称间建立对应关系。⑻句法描述的差别。如DC用XML语言作为元数据传递的载体,而MARC用的是自定义的记录语言[11]。


参 考文 献
[1] 肖述清. 论元数据格式及其关系和转化问题[J]. 情报探索,2007,(6):60—61.
[2] 张晓林. 元数据开发应用的标准化框架[J]. 现代图书情报技术,2001,(2):9—11,15
[3] 张学福等. 元数据及其在网络信息资源组织开发中的应用[J]. 现代情报,
2002,(5):48—49.
[4] 郑清文.,傅欣. 元数据在网络信息资源组织中的应用研究[J]. 图书情报工作,
2003,(10):78—82,25
[5] 徐红. 元数据在期刊信息描述组织中的应用[J]. 现代情报,2002,(6):57—58.
[6] 卞丽. 元数据及其在网络学术资源组织中的应用[J]. 河南图书馆学刊,
2002,(5):51—53
[7] 朱庆华. 元数据在教育资源中的应用[J]. 中国图书馆学报,2005,(2):71—74
[8] 高建勋,吴开华. 元数据发展中的热点问题讨论[J]. 图书馆,2002,(5):41—44,48
[9] 孔庆杰,宋丹辉. 元数据互操作问题技术解决方案研究[J] . 情报科学,
2007,(5):754—758.
[10] 梅海燕. 元数据的研究进展[J] . 现代图书情报技术,2002,(4):17—19,53.
[11] 张东. 论元数据的互操作的层次[J]. 情报理论与实践,2005,(6):648—650
 

 

查看相关论文专题
加入收藏  打印本文
上一篇论文:我国网站评价现状研究
下一篇论文:无纸化办公条件下档案管理的实践与探索
科技论文分类
科技小论文 数学建模论文
数学论文 节能减排论文
数学小论文 低碳生活论文
物理论文 建筑工程论文
网站设计论文 农业论文
图书情报 环境保护论文
计算机论文 化学论文
机电一体化论文 生物论文
网络安全论文 机械论文
水利论文 地质论文
交通论文
相关图书情报
最新图书情报
读者推荐的图书情报