高校图书馆个性化信息服务

三、高校图书馆个性化信息服务

伴随信息技术的发展,国内高校图书馆的信息服务的发展方向也开始转变,差异化的个性服务逐渐被人们所提倡。差异化的服务要求图书馆将信息收集分类,并对不同用户调整服务,使用户便捷地获取信息。这样的转变理所当然地会受到师生的欢迎。那么高校图书馆具体应如何针对用户来制定不同的信息服务?如何满足差异化需求?如何彰显新时代信息服务的差异化特性?这些问题将是推进图书馆信息化服务的关键。

(一)个性化信息服务的发展限制

有差异的个性服务首先应了解用户在图书馆想要获得的信息种类、学科等要求。如今,通过发布问卷、电话咨询、用户反馈等方式提前得知用户的信息需求并开始分析已经是大图书馆的个性服务的普遍做法,针对相应的信息需求再由负责各个学科的在馆工作人员向用户提供个性化的服务。由于受连续信息需求等原因限制,开展个性化信息服务感知用户真实的信息需求,传统个性化信息服务就存在明显不足。

1.无法获取用户真实的信息情境

以往的个性化信息服务模式获得用户需求存在问卷设计上不足、用户文化程度不同、忌惮信息泄露带来严重后果,因此高校图书馆无法准确获取用户信息需求,而这些偏差也严重影响了用户个性化信息服务的体验。

2.服务针对性尚且不足

高校图书馆个性化信息服务要取得良好的使用效果,在校师生是主体,必须及时针对在校师生的课堂教学进度、研究课题任务不断变化等相关信息需求情境实时调整服务策略。然而日常使用中,在校师生往往受时间、沟通不畅等各种因素的制约,无法及时向图书馆工作人员反映自己对信息需求的变化,致使高校图书馆的个性化信息服务与服务对象之间不相适应,差异化的个性服务达不到时效。

3.用户减少带来大量损失

一方面,高校图书馆利用大量馆内资源的优势,希望通过个性化信息服务方式更好地服务使用者;另一方面,个性化信息服务针对性不强,用户大量流失。就如今的年轻人来说,每每有信息需求时,他们首先想到的不是本校大学的图书馆藏,而是百度、谷歌、SNS等,当面临用户减少且优质资源得不到利用时,图书馆应继续解决服务的个性化和提高用户体验等诸多问题。

(二)个性化信息服务系统可行性

1.多种数据渠道

用户产生行为数据大多数都可以被图书馆的信息服务系统所收集,如OPAC系统,用户借阅信息,电子资源的用户电子信息中心的使用痕迹,用户在基于主题的信息服务中使用与图书馆工作人员交互的信息,用户留在图书馆微博的评论,用户访问图书馆论坛的时间,等等。这种数据积累体现了用户信息情况需求的改变,这些行为数据有很高的整合和分析价值,可以及时把握用户当前的信息需求,然后为图书馆做出决定,执行个性化信息服务提供建议。

2.容易识别的目标群体

Web数据挖掘的难题之一是受经费、版权等因素的制约而对目标用户的身份识别。但是目标用户的身份识别对高校图书馆个性化信息服务系统而言,简易又有明显区分度,因为都是在校师生,信息都在本校图书馆登记过,对师生用户行为进行收集,对目标群体及时追踪,获得师生的信息行为,分析他们的信息需求,进而实现差异化的信息推送。当大学生和校园学生访问网络资源时,他们的大部分计算机IP地址都在校园网中心注册,用户名和密码也可以很容易地识别出目标用户。

3.用户信息需求的实时感知

对于大学师生而言,他们的信息需求可以通过其在课堂教学、课题科研或学习方面相关的信息行为体现出来,通过后台服务器如实记录这些信息行为数据,可实时展现信息需求。

(三)个性化信息服务系统构建

1.系统构建目标

高校图书馆个性化信息服务系统在大数据环境下的构建目标:分析庞大网页的数量,在图书馆现有的信息服务平台模式的基础上,整合海量已被请求用户产生的用户行为数据,即最终目的是通过对互联网上用户信息日志、临时对话、浏览习惯、检索痕迹、用户ID目录,把握用户变化的信息需求,并以此开展针对师生用户的信息的个性化信息服务。

2.高校图书馆个性化信息服务模式

采用收集用户行为信息的方法掌握用户变化的信息需求,以实现汇总、分析、利用的数据处理要求,图书馆个性化信息服务系统需要将集成模块、数据常规化处理模块、信息分析模块(包括结构化数据分析模块,网络协议分析模块,移动终端定位模块)、用户评估模块。满足包括数据收集、数据标准化、信息分析、信息过载和其他功能需求。

3.高校图书馆个性化信息服务系统模块功能

(1)数据集成模块

用户的信息行为数据并不统一地存放在图书馆数据中心里,所以该数据模块将用于汇总各种行为信息,这包括系统运行记录、各学科服务记录与反馈、馆内电子文献查阅记录等。将这些不同方式、行为、用途的行为信息相互联系并仔细分析,可以用来建立强大的数据整合模块。

数据集成模块工作流程如:

合成记录→数据规约→数据清理→数据变换

第一,合成记录。不同服务提供商的系统信息中心的数据字段的格式和含义各不相同,图书馆又是不同服务提供商的产品系统。在大学,师生使用图书馆的资源、先办理具有编号的图书借阅证,这样就成为用户特有的标志,就能够收集用户差异化的行为信息并有效整合。

第二,数据规范。各种信息中心或网络协议中的信息保存和发布时的规范不尽相同,数据规范对这些具有不一样的名字但具有相同意义的数据进行规范,增加信息准确度以提高数据分析的准确性。例如校园网络日记与普通读者信息库中性别登记就有所不同,校园网络信息中心网络的用户网络协议中的信息记录可以是“male”或“female”,读者信息库中的性别记录可能为“man”或“woman”,事实上是没有区别的。

第三,数据清理。数据清理模块主要用于清除垃圾数据,干扰数据、错误记录。将经过合成记录模块和数据缩减模块处理的数据,每个用户在不同数据系统中的行为记录将被汇总到相同数据库中。这些相同的字段都是反复记录的,所以最后经过处理只需要保留一条字段的相关信息属性;对于不完整遗失的数据信息需要完善,一些数据需要纠正,一些数值是需要离散化的实际值。

第四,数据变换。数据转化模块是通过等价聚合和数据泛化,将各个来源的基础数据的分析算法变化为适应数据利用需求的数据形式。

(2)信息分析模块

现在的大学师生需要查询信息时,可通过手机在线进行社交网络查询,使用虚拟人际关系来获得信息帮助,主要节点就是人,而非网页,这是非结构化信息,需要采取特殊的信息分析策略来进行有效分析。通过互联网搜索引擎会在服务器日志文件中留下使用痕迹,这是半结构化信息,恢复信息对用户的网络信息行为进行相关分析属于互联网日志分析模块功能范畴。通过图书馆来获取资源,图书馆会采用相应的科学技术对用户的反馈信息、相关咨询等进行记录,以正规形式存储在对应的整合信息库中,属于结构化数据。

第一,结构化的信息分析模块。结构化信息具有固定和规范的数据格式,根据用户信息的行为对数据聚合和标准化数据执行数据挖掘操作,创建聚类,并在数据挖掘后对相关数据进行分类。用户被划分为不同的视点,以识别各个用户中有相似信息行为和同一名用户在各个时间段内的信息检索记录。

第二,半结构化信息网络日志分析模块。互联网日志文件会翔实地保存于用户访问网络服务器,通过分析这些数据,用户当前的信息需求将被快速准确地知道。

互联网日志分析模块分3个工作步骤:

合成记录→数据规约→数据清理→数据变换

数据处理模块主要用于清理有关数据,确认用户身份,减少无用信息导致的系统信息库的膨胀。

在访问互联网信息时,用户存在不通过网页上的链接功能访问页面的情况,即利用浏览器历史记录所产生的缓存达成间接访问的目的,路径模块的用途就是保存用户访问路径,并及时调用记录简介访问该路径。

在掌握用户需求的技术上,详细地记录网页的浏览次数以及每次的浏览时间非常重要。如果用户经常访问特定页面或长时间保留在特定网页上,那么该用户对于该信息或网页的兴趣程度就会被记录。访问统计模块提供用户浏览相关页面的频率。统计用户在浏览网页时的频率对于掌握用户的信息需求有重要的利用价值。

第三,移动信息分析模块应该适应手机发展以及新出现的平板电脑等设备,在如今终端设备获取信息要求快速、高效的社会中,在高校图书馆优化个性化服务的过程中,也要适应新终端带来的变化并拓展自身在社交平台等自媒体中的服务渠道。该模块将用户在移动终端上的互联网浏览记录、行为记录加以分析,以获取用户信息需求的方式是图书馆个性化服务的重点。

(3)信息匹配模块

移动信息分析模块的本质是移动类型的终端设备,用于收集用户在网络上的阅读记录和行为记录,推送每个用户差异化的定位、爱好和其他信息,以及其他用户感兴趣的信息。高校图书馆工作人员在信息匹配模块,以精确协调信息源满足用户的实时信息需求。

(4)信息推送模块

信息推送模块可以为各个用户之间的信息接收类型做出相应调整。系统给用户推送感兴趣的信息,即后台推送模式:首先,用户阅读书籍或电子资源后,可以推荐给用户那些其他用户在浏览相关方面时的内容,具体推荐用户尚未搜索的信息源;其次,当用户使用图书馆微博、微信和学术服务时,用户首先根据数据分析的结果询问相关信息;最后基于将用户订阅的信息准时发送给用户使用的终端设备上。

(5)用户使用评价模块

个性化信息服务系统利用获取的庞大数据信息,识别用户的意图并将相关信息传送给用户。为了提高用户接收到相关信息时个性化信息服务的相关性和系统服务的准确性,用户可以直接评估通过评估模块接收到的信息,并将用户的评估数据自动存储在个性化信息库中。图书馆的工作人员未来在进行个性化信息服务时需要以数据库中的行为信息作为依据,有效提高个性化信息服务系统对服务的影响。

(四)运作个性化信息服务系统

1.个人隐私可能泄露

个性化信息服务系统可以采用以用户数据的分析利用,找到用户潜在的行为关联,对用户信息进行适当处理。但是为了更好地获取用户信息需求,用户信息系统会实时捕捉并记录用户信息,这对于用户的隐私安全来说存在着相当大的隐患。为了保护用户的隐私安全,在获取用户行为记录之前需要用户的许可,在数据分析之前必须清除用户数据涉及隐私保护信息,删除不与个性化信息服务相关联的数据,尽量避免损害用户隐私。

2.数据来源的控制

个性化信息系统的数据源大多限定在大学,对于用户在校园外的互联网信息,则必须通过与移动网络运营商进行商议合作才能获得。而且只有当用户上网记录达到一定积累且具备连续性时,才能通过个性化数据解析系统进行数据深层次整合,得到具有价值的用户信息需求特征。这些限制数据源在一定程度上降低了识别用户信息的准确性。