高校图书馆大数据

一、高校图书馆大数据

(一)高校图书馆所拥有的大数据

高校图书馆的大数据来源同样呈现出多样化的特征,除了包括传统的电子书籍、期刊、数据库论文等结构化数据资源之外,还包括以下海量的非结构化的信息资源:

1.智能设备数据

那些装有RFID图书的信息,可以自动实现资源的追踪和解析。就好像RFID数据信息,它可以帮助我们根据读者到图书馆读书的时间做出相应的人员配备,为读者提供更好的服务且保留有大量读者的进出馆信息的,像门禁一样的系统。

2.物联网数据

对所处的环境和资源进行数据采集可以通过在图书馆不同位置或环境中放置传感器,通过长久的累积,可以产生非常多的数据,对我们分析图书馆的使用状况,优化配置资源都有极大的帮助。

3.互联网数据

这部分数据的产生速度超过以往任何一个传播媒介,这是因为社交网站的普及,图书馆服务的一大评价指标来源是参与的众多用户及其数据中所包含的丰富的情感特征。另外同样包含着读者丰富的信息的是类似于OPAC读者的搜索记录、数据库中读者的访问记录等的一些用户行为信息。这些都是图书馆大数据的重要组成部分。

4.科学研究共享数据

作为科学研究服务中心的高校图书馆,需要构建出数字形式的共享研究数据,其中包括在研究过程中所产生的能被存储在计算机中的任意数据。还包括一些非数字形式的数据,其能够被转换成数字形式,比如调研成果、神经图片、实验中产生的数据、传感器读取的数据、遥感勘测出数据信息、来自测试模型的仿真数据等的科研数据。含有巨大的研究价值的科研数据信息是科学研究过程中重要的研究成果。图书馆需要着重收集的一个大数据来源,就是科研共享数据。

5.移动互联网数据

普及高校移动图书馆、可以让图书馆运用移动互联网技术,获取大量的读者访问数据,进而从这些数据中解析出读者的读书习惯和阅读倾向等,这有助于我们对其展开有效的分析,预判读者所需要的知识服务。

(二)高校图书馆拥有大数据特征

在图书信息资源不断发展的今天,读者对于图书馆知识服务的要求也在不断提高,这就决定了图书馆在大数据时代应具有大数据所拥有的特征。

首先,图书馆所含有的数据资源在编码和格式上在内部都无法达成统一,因为其不但有一部分基础的文献资料、网络数据资料、光盘数据资源等,而且还有一部分读者的信息和图书馆提供服务的信息,另外包括图书馆自身发展的数据信息,从而形成了大量的异构数据。

其次,图书馆必须要依据用户的服务信息等数据做出相应的服务策略转变,全国图书馆数字资源总量是一个庞大的数据集,图书馆的数据资源每天都在增长,无法避免地要对大量数据的分析与潜在价值进行挖掘。

最后,图书馆的一些像24小时服务、其他网络服务等的新兴服务方式的出现,增加了用户的数据信息,需要一些限定的环境和条件才能对这些数据进行挖掘和整理。最后,虽然数据库的记载与统计已经达到了新的水平,图书馆也已经进入了一个发展比较迅速的阶段,但是这些数据还需要进行异构化的处理。