馆藏档案数字化
馆藏档案信息的数字化是档案信息建设的一个重要组成部分,其主要目的是利用计算机、扫描设备、图像处理技术等现代信息技术将传统的介质存储的各类档案,根据需要进行数字化处理,以积累数字档案资源。档案馆经过几十年的建设,不仅将各种档案信息组织化和有序化,而且形成了丰富而独特的档案文献信息资源。在档案馆收藏的大量经过整理、分类的档案文献资源,除极少数在其形成的过程中和前期运行阶段就采用了数字化记录形式以外,绝大部分是纸制档案。针对这一现状,现阶段和今后一段时间内,对纸制档案信息进行数字化转换,便成为档案馆藏数字化的中心任务。
(一)馆藏档案数字化的工作内容
馆藏档案数字化主要包括两项任务:一是将传统载体的档案目录进行数字化,二是将档案内容进行数字化。
档案目录数字化的主要工作是对载体档案进行编目,并将目录信息录入到计算机中,建立档案目录数据库,利用管理信息系统实现档案目录数据的计算机管理和目录信息的资源共享。
档案内容数字化的主要工作是馆藏的纸质、录音、录像、照片等档案,通过扫描、加工、处理转变为文本、图像、图形、流媒体等数字格式信息,存储在网络服务器中,利用计算机及信息系统提供查询、检索和浏览。
档案内容数字化工作包括数字化预加工和深加工两个步骤,数字化预加工能够将纸制档案、照片档案、微缩胶片等转变为电子图像文件,不能将纸制档案上的文字信息金行完全处理;数字化的深加工则是利用技术含量较高的语言识别处理技术获取载体档案中的文字信息,方便提供全文检索。
(二)馆藏档案数字化的业务流程
1.数字化的预处理
预处理是数字化加工的第一步,其主要的工作是将馆藏的实物档案,比如纸制档案、录音录像、照片、微缩胶片等按照数字化加工的轻重缓急原则进行筛选,然后再按照下一步数字化处理工作的具体要求做拆分、分类、整理、模数转换等处理工作。此环节中的安全风险主要来源于公共环境等人为因素,主要安全任务是防火、防抢、防盗、防泄漏以及防止因错误操作而导致档案受损的事故的发生。因此该阶段采取的安全防范措施是:按照加工工序制定严格的安全管理制度,明确各工作的岗位职责,并严格监督执行;启动档案馆的安全监控系统,实行实时监控,一旦出现问题应立即采取措施。
2.数字化加工与转换
就是将传统的档案转换为数字形式标识的档案信息资源,其主要工作包括:纸制档案的扫描,录音录像、数码拍照的数字化转换,微缩胶片的数字化等。本阶段安全问题主要是加强对损坏程度比较严重的纸质又很薄、很难直接进行扫描或者无法采取扫描方式进行数字化的历史档案的处理。本阶段的安全重点是数字化过程中原件的保护,必须在大量实践经验的基础上,选择科学的、合理的数字化加工与转换的技术与指标开展工作。
3.信息的处理
信息处理的主要工作是将数字化后的图像文件、多媒体信息等与档案的著录信息进行关联的重要过程,也是整个数字化工作的重要内容。首先是档案资源的编目、标引等基础数据的录入和处理等工作,其次是将图像与多媒体文件对照原始档案而进行的核对、压缩等处理工作,无论是纸制档案还是录音录像档案通过模拟到数字化的转换后,都可能造成一定程度的数据丢失或信息的失真。因此本阶段的安全重点是保证档案数字化后能够被存储、保存和提供利用,并考虑如何将失真度降到最低的问题。
4.信息的存储
经过处理的数据需要存储到网络环境中并提供利用,而不仅仅是存储在光盘上保存在库房做档案备份。因此应根据数字化的存储容量及网络化提供利用的要求,选择网络存储设备、考虑数据库与电子文件存储和被访问的方式,这一阶段安全的重点是考虑电子文件的存储和保管的安全模式,严格按照档案管理的标准开展规范化操作。
5.信息的利用
这一阶段将采用计算机应用软件系统,按照档案法及本单位的管理规范,将数字信息发布到网上,并提供不同网络范围内的不同数据内容的档案利用。本阶段安全防范的重点是:系统用户权限的严格管理、对访问系统中用户身份的严格认证以及内网、外网计算机之间的访问控制等安全问题,同时还要严格管理网络上各服务器、客户端等计算机系统,并防止应用程序受病毒的感染、网站受黑客的攻击等非安全因素的发生。
(三)馆藏档案数字化方案的确定
选择什么样的方式是进行馆藏数字化的关键。由于档案馆保存的档案数量众多,不同档案的价值信息,开放利用的时间不相同、对不同档案的保密程度也各不相同,因此在档案信息化之前,档案馆必须确定哪种信息可以数字化、哪种档案信息资源目前不需要或者暂缓数字化,哪些资源应优先数字化。最后选择何种方案,应当紧密结合馆藏的具体情况和社会利用发展趋势做出判断。目前主要有以下几种形式:
1.全部馆藏数字化
采用此方式是将传统的档案馆全部馆藏信息数字化,建立数字档案馆,完全继承传统档案馆的全部信息资源。这是理论上最彻底的数字化方案,对利用者来说是最理想的。这种方案比较适应那些馆藏档案数量较少,开放档案占据绝大多数馆藏档案的档案馆。对于那些馆藏数量众多,利用率较低,且档案数量大、需要控制利用档案的数量较多的档案馆,从降低成本和效益的角度来考虑,不一定是最佳策略。
2.高利用率馆藏数字化
这种方案在一定程度上可以起到降低成本、提高效益的作用,但具体实施有一定的困难。一般来说,不同用户所需要的档案信息,在范围和重点方面有不同的特点,且对不同类型的档案信息的使用频率也不同。另外一部分高利用率的档案具有时效性。因此档案馆向利用部门提供一份较长时间的利用反馈报告,可能会有助于对馆藏高利用率档案的合理选择。
3.珍贵馆藏数字化
从理论上说这是最合适的方案,其难点是对“珍贵档案”必须具有可操作性的诠释,这种可操作性应是建立在对馆藏档案资源熟悉和价值判断的基础上。一般地说,那些高龄档案,涉及某一地区重要机构、重大事件和重要任务的档案,在同类档案文献中较为稀少的档案等,都可以列入珍贵馆藏之列。一般来说这部分档案的利用率是很高的。
4.即时利用数字化
即对部分档案并不数字化,只是到利用时才进行数字化。这是最具功利色彩的“用户至上”方案。所有用户不需要的馆藏均被排除在外,这是该方案最突出的优点,但也是最致命的弱点所在。用户的即时需求有很大的偶然性,过分考虑这一需求,无疑会提高档案馆数字化的经济成本。
总之,选择什么样的信息化策略应根据实际需要来定,不考虑实际需要单纯地选择某一种方案都会导致片面,如何兼顾馆藏具有永久价值的档案和用户当前的信息需求,将几种数字化的方案有机地结合起来,才是馆藏档案数字化的最佳方案。