数字图书馆信息源

二、数字图书馆信息源

随着信息技术的发展,需要存储和传播的信息量越来越大,信息的种类和形式越来越丰富,传统图书馆的机制显然不能满足这些需要。因此,人们提出了数字图书馆的设想。数字图书馆是一个电子化信息的仓库,能够存储大量各种形式的信息,用户可以通过网络方便地访问它,以获得这些信息,并且其信息存储和用户访问不受地域限制。

数字图书馆的含义很广,它不是简单的互联网上的图书馆网页,而是一整套面向对象的、分布式的、与平台无关的数字化资源的集合。广义而言,数字图书馆包括所有数字形式的图书馆资源。所以,目前形式多样的数据库都将成为数字图书馆资源的组成部分。作为国家信息基础设施的核心系统,我国的数字图书馆正在实验和研究之中,数据库产品成为提供数字信息的重要途径。按照出版形式,数字图书馆信息源可以分为以下三种类型。

(一)二次信息库

二次信息库,俗称文摘数据库。这类数据库不提供全文,仅提供原文的相关信息,比如题名、作者、出处、摘要等,便于读者快速了解原文的内容,能让读者方便地找到它。这是数据库的初级阶段产品。全文检索技术出现之前,由于数据库的容量有限,二次信息库成为当时主要的数据库产品类型。后来,受到全文数据库的冲击,二次信息库曾一度走入低谷。近年来,凭借信息分析、聚类、挖掘技术等新兴计算机技术的应用,其又以强大的分析预测功能取回了属于自己的那一部分领地。

二次信息库的类型很多,主要有书目数据库、文摘数据库和引文数据库等。书目数据库主要用于揭示图书的基本信息,例如图书馆的馆藏联机目录数据库。文摘数据库对期刊论文、会议论文、专利文献、学位论文等类型文献的内容和相关信息的报道往往具有强大的分析和挖掘功能,如新出现的Scopus数据库。引文数据库则从文献之间相互引用的独特角度出发,力图反映文献的质量及某个科学问题的发展历程,如科学引文索引(SCI)、社会科学引文索引(SSCI)和我国的中文社会科学引文索引(CSSCI)都是引文索引数据库。

(二)全文数据库

顾名思义,全文数据库就是收录原始文献全文信息的数据库。这是在文摘数据库的基础上发展起来的数据库,所以一般的全文数据库都提供文摘,还有全文可以下载。这样便大大简化了信息寻找的过程和时间,受到了人们普遍欢迎,成为当今数据库的主流产品。

全文数据库的类型很多,按照出版形式可以分为图书、期刊论文、会议论文、学位论文、政府出版物、法律条文和案例、商业信息等。如超星数字图书馆是电子图书数据库,中国知网和中文科技期刊数据库(维普网)是期刊论文库。

(三)互联网信息源

网络的互联造就了前所未有的巨大的信息资源宝库。根据互联网追踪机构英国著名咨询公司Netcraft的调查结果,2011年11月全球网站数量突破5亿个大关,比2010年的2亿个增加了1.5倍,而中国的网站从2009年的323万个减少到191万个,但是,网页的数量达到了600亿个,比2009年增长了78.6%。而网民数量从2009年的3.84亿人增加到5.13亿人,手机网民的数量也达到了3.56亿人。网民数量的增加,说明互联网的市场机会越来越大。但网站的数量刚好相反,说明市场竞争的难度也越来越大。中国互联网中心(CNNIC)2020年6月发布的第46次中国互联网络发展状况统计报告显示,中国网民规模已达9.4亿人,互联网普及率达到67%,其中手机网民规模达到9.32亿人,网民使用手机接入互联网的比例高达99.2%。[2]截至2020年6月30日,我国5G网用户已经突破1亿大关,上半年我国手机上网流量达到720亿GB。[3]互联网信息源具有数量庞大、类型繁多,多媒体、多语种,分布式存储、跨国界传输等特点。利用网络搜索引擎和学科门户,用户可以在任何主题领域找到自己感兴趣的信息,其中大部分资源是免费的。这些免费的网络信息资源将集中在第六章进行介绍,其他通过许可访问方式开放的数据库资源则分别在第四章和第五章中介绍。