手机版
ENGLISH

当前位置:地方文献 >> 21世纪地方文献工作发展研究论文选
 

                    零散地方文献在特色数据库建设中的开发和应用研究

  陈俊华 金文坚

  (汕头大学图书馆广东汕头 515063)

  

  [摘 要] 零散地方文献具有篇幅小,涉及内容广泛、时间序列长等特点,而且来源复杂、存储形式多样。它们在存史等方面发挥着不可代替的作用,也是特色馆藏建设的一个重要方面。本文结合特色数据库的建设实践,经过整理、扫描和加工制作、元数据描述、XML发布等步骤,为读者提供了一个零散地方文献的检索和阅读平台,实现了零散地方文献工作从传统到现代的飞跃。

  [关键词] 零散地方文献 特色馆藏 特色数据库

  

  1 零散地方文献及其开发意义 

  11 零散地方文献及其特点 

     零散地方文献通常是指不成书的内容涉及地方的零散资料,包括研究报告、会议资料、工作总结、快报、动态、信函、票据、通报、广告、商标、手稿以及各行各业各系统自编的内部资料,如地方旅游资料、地方工农业产品资料、厂史、厂庆资料、企业小报;地方团体如学社、诗社创办的小型不定期资料等等。联合国科教文组织对书籍的定义是“除去封面至少49页以上的非期刊印刷出版物”,可见49页(含49页)以下的地方文献可视为零散地方文献。这类零散地方文献外部形状各异, 开本、规格也大小不同,少则一页,多则数十页,印刷种类繁多, 装订式样各异。 

     随着网络对社会活动的不断渗透和网上资源的日益丰富,零散地方文献的外延有所拓展,它还包括零散地分布于NEWSBBS、博客、网上出版物等数字载体中、内容涉及地方专题的信息,这些资源都可以从网上查寻下载后存档。此外,分散在图书、期刊、报纸等其它各类文献中的与本地有关的各种信息也属于零散地方文献的范畴。 

     可见,零散地方文献具有资料来源复杂、存储形式各异等特点,而且涉及的地方内容广泛、时间序列长,多数是不可再生的一次文献。 

  12 零散地方文献在特色馆藏建设中的作用 

     虽然零散地方文献的留存形式多样,篇幅小,但具有不可多得的特殊意义,图书馆应当给予必要的揭示。如未能公开发行的会议资料、总结、产品报告等。提供了大量的有用信息,而手稿、拓片、单据、图片等零散资料,或多或少存留着地方文化和地方历史,有较高的利用价值。从表面上看,有的虽只纸片文,彼此之间似乎缺少联系,但当我们把它们搜集起来并集中整理后,就可以看出它们大多能够比较系统地反映当地某个方面的发展历程,记录居民生活的轨迹与状况。例如,当地早期的钱庄票、契约等,收集到一定数量时就会发现其中的史料价值是不言而喻的。这些零散地方文献积少成多便具系统性和专指性,它们往往反映了当地的政治、经济、风土人情和历史发展的情况。这些资料的收集和整理利用,对于区域文化的保存和研究都有现实意义,而且特藏性质明显。 

     在资源数字化、网络化的今天,建设特色馆藏是图书馆界的共识。特色馆藏是指一个单位收藏的资料具有自己的独特风格, 这些独有的资源较他处更全面、更丰富。对图书馆或情报所而言, 建设特色馆藏具有重要作用,在未来藏书机构格局中,拥有特色馆藏将成为个体机构存在的基础。由于每个图书馆拥有的零散地方文献都与该馆的历史背景、地理位置、专业特色、服务性质有很大的关系,相对来说,与它馆的重复率低,容易形成特色,具有真正的共享价值。 

  13 特色资源要走数字化道路 

     由于零散地方文献分布的广泛性和隐含性,内容零碎分散、繁杂无序的特点,给整理工作增加了难度。如果逐件著录,不仅费时费力,还会造成目录臃肿,影响读者的检索,所以部分图书馆未能开展这项工作。零散地方文献因此被堆积起来,无人过问,更谈不上为读者所利用,造成很大的浪费。 

     有的图书馆采取分组整理、分组著录的方法,将零散地方文献按其事件主题和时间进行归类集中,装订成册,再进行著录和加工,与普通图书一样上架。制成的目录可以自成一体,也可以加入到图书馆常规目录中。在编目时,它的题名、责任者和附注项作为重点款目来著录。对于装订成册的零散地方文献,著录题名时应自拟,自拟题名要能充分反映本册资料的内容,并用“[ ]”括起,在附注项内要注明本册资料的内容范围和时间范围,并做子目,一一列出其中每一份资料的题目,以进一步揭示文献。 

     由于零散地方文献的内容涉及政治、科技、经济、文教等社会的各个领域,上述分组编目的方法仍难以深入地揭示文献的内容和特征。而随时新增的资料客观上也会给这种模式的管理制造了困难。如果不装订,这类资料上架后很容易造成破损或遗失。总之,各种问题的存在都会导致这一类文献资源难以得到充分的利用。 

     现在,“资源数字化”正是这些数量不菲、内容丰富的零散地方文献能够为读者所真正利用的一把钥匙。我国特色数据库的建设已经起步,CALIS(全国高校文献保障系统)为了形成中国高校独有的数字化特色资源,将专题特色数据库的建设列为重点项目之一,并指出可从以下三方面建设特色数据库:第一,学科特色,以某重点学科或某特定专题、或具有交叉学科和前沿学科、或能体现高等教育特色的资源;第二,地方特色,如具有一定的地域和历史人文特色,或与地方的政治、经济和文化发展密切相关的资源;第三,馆藏特色,如具有他馆、他校所不具备或只有少数馆具备的特色馆藏,或散在各处、难以被利用的资源等。零散地方文献同时具备了地方特色和馆藏特色,应当成为特色数据库建设的首选资源之一。 

     特色化和数字化是当代图书情报单位发展的两大主流,特色资源数字化能够把特色馆藏推上新的高度。很多单位以“十一五”规划为契机,已经将特色馆藏建设提升到一个战略高度来认识并积极规划实施。零散地方文献的数字化可谓生逢其时,通过计算机处理, 使其在资源保护、信息检索和提供利用等方面显示出方便、灵活的优势,有利于实现真正意义上的信息资源共享。 

  2 为零散地方文献资源建立特色数据库的优势 

  21 利用计算机技术使零散地方文献得以最大限度地保存 

      以纸张为媒介的资源容易受到空间的限制,尤其是零散地方文献中的纸质资料,随着时间的推移就会出现遗失、破损、无处存放等现象,而建立原文数据库是很好的解决方法。通过扫描、拍摄等手段,结合计算机存储技术,零散地方文献的寿命将得到最大限度的延长。笔者曾于去年8月往新加坡参观考察,了解到新加坡档案馆的做法。该馆首先利用成熟的缩微技术把到馆的全部资料进行缩微拍摄,然后仅鉴定挑选其中10%价值较大的档案留作馆藏,给予周到的保管,剩余90%的档案作销毁处理。读者则主要通过缩微胶卷来利用档案,而不是实体档案。同样的道理,我们对零散地方文献数字化之后,读者可通过计算机来检索和阅读相关的文献,在空间和人力不足的情况下也可以考虑不再收藏零散地方文献的实体,已收藏的也可以逐步作剔旧处理。当然有长期收藏和增值价值的资料除外,如我馆收藏的侨批、契约、钱庄票等。 

  22 有利于资源的远程检索和传播,实现资源共享 

     纸质载体资源的信息传输力度是有限的,零散地方文献的流通与使用更是呈现出鲜明的区域性,故而其信息传播的时间、空间与使用效率都受到限制。受益者通常是直接到馆的读者,因为只有他们才能阅读到原始文件。而在今天的网络时代,数据库形式的资源,可以跨越时间和空间的限制,为大众所利用,其在资源共享方面发挥的巨大作用是显而易见的。 

  23 有利于提高查询速度,提高查准率和查全率 

     将零散地方文献的工作置身于电子技术及网络环境中,利用现代技术对资源进行数字化处理并提供服务,使相关资源在网络环境中得到深度的开发。我们可以将这些不同来源、不同途径、不同载体的零散数据逻辑地归于同一检索界面中供读者综合使用,提高了查询速度和查准率查全率,这使我们的特色资源开发工作获得较高的起点,为零散地方文献建设开辟了新的空间和实现途径,对零散地方文献的整合利用起到积极的推进作用。 

  3 零散地方文献特色数据库的建设模式 

     我馆的特色库项目“潮汕文献数据库”是CALIS的资助项目之一,因为它同时具备了地方特色和馆藏特色。我们在建库的过程中,非常重视零散地方文献的数字化工作,为特色资源创造了较全面的管理平台,建立了完备、多角度的检索系统,提高了读者的满足率,收到了理想的效果。 

     标准化是数据库建设的生命,也是数据库质量的保证。我馆建设专题特色库的捷径,就是依据CALIS中心研制的相关标准和规范来建设自己的专题特色数据库。 

  31 零散地方文献的原文数据加工 

     CALIS资源数字加工与发布标准》规定了不同资源类型的数字加工的对象,扫描技术参数和数字文件格式。对于纸质零散地方文献,我们采用清华TH- OCR2000 汉字扫描识别加工系统来进行扫描和加工。读者在前台阅读到的是第一层,即扫描版的资源,它维持了资料的原貌,又称为原文数据,而经过OCR识别后的文字保存在第二层,可以为读者提供全文检索和文本复制。对于从网上下载的相关数据,我们统一整理成PDF格式入库。对于票据、契约、照片、拓本、表格、票据、手稿等资源,则利用数码摄影或扫描录入的方式建库,以保存文献资料的原汁原味。 

  32 元数据描述和标引 

     元数据是专门用来描述数据的特征和属性的, 是对信息资源进行全面描述和标引的主要手段和途径,也是进行数字信息资源组织与管理的基础。1995 年在都柏林元数据会议上正式提出的DC 经过不断修改和完善,已经成为广泛接受的元数据标准。CALIS中心也推出了其相应的元数据规范《描述型元数据及其著录规则》,涉及到古籍、电子图书等12个系列。我们在标引零散地方文献时使用到的规范就有舆图描述元数据规范、拓片描述元数据规范、网上资源描述元数据规范等。如果是CALIS未列出的类型,我们也参照已有规范做出自己的定义。DC通用的15 项基本元素包含了零散地方文献需要标引、描述的内容属性和形式特征,在其基本元素的扩展中也做了较为灵活的规定,这对全面深入揭示和表达零散地方文献具有较好的适应性。如借助主题及关键词项,可以直接使用自然语词对零散地方文献所涉及的专指概念进行描述标引,以期全面表述零散地方文献,增加匹配条件。 

  33 标记语言的选择 

     在数据库设计方案中,标记语言的选择也是关键的步骤。DC元数据要嵌入到相应的标记语言中,才能为WEB的应用提供描述数据和交换数据的有效手段。DC系列元数据中通常使用的标记语言有HTMLSGMLXML。其中,XML有较大的优势,它既没有SGML那么复杂,又不像HTML一样要预先定义好的一套标记系统,难以扩展。XML的标记不是固定的,它允许定义数量不限的标记来描述文档中的资料,允许嵌套的信息结构存在。XML灵活的可扩展性和较强的适应性,使它很可能成为在WEB数据库应用上最通用的标记语言。从长远看来,基于XML 格式的元数据是大势所趋。 

     XML来标记零散资源的元数据,有利于这些资源在网络环境下的集中管理和检索共享,下面是一条用XML格式元数据描述的一张旧地图资料示例:

  <?xml version="1.0" encoding="GB2312" ?>

  - <MetaData Version="3.1">

    <DocType ID="META022" Name="图片" Version="3.1" />

  - <Content>

    <Title>解放前汕头市市区地图</Title>

    <Abstract>1947年的汕头市区地图。说明:一、本图的马路线系根据民国十六年省政府核定汕头市改造计划图编绘;二、市区图系本年根据五区专署实地勘定。</Abstract>

  <Author Extent="编绘者">钟一苇,贺瑞典</Author>

  <Author Extent="校核者">张公一</Author>

    <Subject>解放前</Subject>

    <Subject>汕头市</Subject>

    <Subject>地图</Subject>

    <Publisher>汕头工学社</Publisher>

    <Date>民国三十六年十月编绘</Date>

   <CartographicMaterials Extent="比例尺">五万分之一</CartographicMaterials >

    <PhysicalDescription Extent="外观形态">纸;彩色</PhysicalDescription >

  <Coverage>汕头;民国时期</Copverage>

  <Type>图像资料</Type>

    <Source>http://www.ydtz.com/news/htm/zr-stmap/1948/1948.htm</Source>

    <Format>JPEG</Format>

  <Format Extent="文件大小">289KB</Format>

  <Format Extent="象素">2192×1740×24b</Format>

    <Rights>公开</Rights>

    <Language>汉语</Language>

    <ClassCode>8</ClassCode>

    <XKDM>专门史</XKDM>

    <class>地图</class>

    </Content>

  - <Admin>

    <ContentFile>jfqstsqdt.jpg</ContentFile>

    <Page >1<Page />

    <FileSize>80855</FileSize>

    <DateCreated>2005-05-11 10:10</DateCreated>

  ……

    </Admin>

    </MetaData>

  

  随着建库软件的日益成熟,标记语言的选择成为程序员的工作,编目员并不需要了解后台是如何使用XML来发布数据的,只要根据计算机屏幕上显示的工作单逐个著录每个款目的信息,完成该数据资源的DC元数据描述和标引,然后在系统菜单中选择“资源输出(或发布)”,就能完成相应的建库流程。 

  4 结束语

  零散地方文献内容广泛,含金量高,不能因为其“小”“散”而忽视它们,其特有的信息是其它文献所无法取代的。零散地方文献的特色数据库建设是一项艰辛、细致、繁琐的工作,无论是最初资料的筛选和收集,中期的扫描加工制作,还是后期的元数据标引、XML发布等,每一步骤都要遵循各项原则和规范。承建者不仅要有崇高的敬业精神和踏实的工作作风,还应具备较高的图书情报专业素养和综合能力。该数据库的建设实现了零散地方文献工作从传统到现代的飞跃,不仅为广大读者提供了一个灵活方便的信息资源检索和阅读平台,也是为我国正在建设数字图书馆添砖加瓦。

  参考文献 

  1.黄俊贵. 文献编目工作.北京:北京图书馆出版社,2002

  2.骆伟. 地方文献可持续发展刍论. 图书馆论坛, 2005(2)

  3.张勇,杨东. 谈地方文献资源建设. 中国图书馆学报, 2002(6)

  4管莉萌. 零散地方文献资料的收集与整理. 图书馆, 2003(1)

  5.赵长海. 论信息时代高校图书馆地方文献工作——以河南文献网为例. 大学图书馆学报,2004(1)

  6.周毅明. 零散地方文献的特点、整理与利用. 质量天地, 2001(5)

  7CALIS 专题特色数据库子项目官方网站. [2006-04-08]. http://www.calis.edu.cn/ calisnew/calis_index.asp?fid=3&class=5

 

湘ICP备05011312 版权所有 湖南图书馆 备案证书
WebMaster:web@library.hn.cn