日本国内近代史研究相关基础史料的数据库建设现状

日本国内近代史研究相关基础史料的数据库建设现状

[日]田中智子(1)

在日本,历史文献的数字化早已成为既定开发项目,目前正处于尝试对个别启动项目进行统合、重整与发展的阶段。笔者谨从日本近代史研究者这一“使用者”的视角出发,对为日常研究提供数据库支持的国立机构各类平台展开概述,并就其意义加以考察。

一、国立国会图书馆

位于东京国会议事堂旁的国立国会图书馆(National Diet Library)创立于1948年,是目前日本国内规模最大的国立图书馆,其作为“图书馆的图书馆”长期以来发挥着重要作用。许多利用文献资料进行研究的人,如无法从周边的图书馆查询到所需的资料(图书、杂志),最终都会寻访到此。进入21世纪以来,国立国会图书馆的数字化进程加速,对历史研究的现状产生了巨大的影响。

(一)近代数字图书馆

近代数字图书馆(Digital Library from the Meiji Era)2002年开始提供服务,它将国会图书馆收藏的明治时期(1868—1912)、昭和时期(1912—1926)的刊物按其著作权解禁年限的顺序依次在网上(2)进行公开,目前已公开约35万册刊物,可免费下载、打印PDF文本。

日本近代史研究者几乎皆受惠于此网站。为此,查阅图书和杂志史料的顺序也变为先上网访问国会图书馆的“近代数字图书馆”网站,确认相关图像有无公开后,再查询其他机构的藏书情况。原来的顺序则截然相反,是先从周边的图书馆等开始查询,最后才会亲自前往国会图书馆。

2016年6月1日,“近代数字图书馆”结束服务并入“国立国会图书馆数字馆藏”,本文介绍的各种已数字化的档案资料至今仍在持续扩充。

(二)国立国会图书馆数字馆藏

国立国会图书馆为了兼顾资料的利用与保存,几年前开始实施数字化转存工作。2009年以后,数字化媒体原则上全面取代了缩微胶片等。有关其现状,国会图书馆发布的《有关资料数字化》一文中有详细的说明,可自行点击阅览。(3)

“国立国会图书馆数字馆藏”(4)的创设即为该图书馆数字化工作的一大成果。该馆所收藏的图书(明治时期—1968)、杂志(明治时期—2000)的数字化工作目前均已完成。

这里除了图书、杂志外,还有五个二级目录:一是《官报》。作为政府报刊,创办于明治时代,并延续至今,是日本近现代史研究的基础史料。目前,网上公开了1883年7月2日(创刊日)至1952年4月30日的部分;二是“宪政资料”。它存放于国会图书馆东京总馆的“宪政资料室”,是研究明治以后著名政治家、官僚必不可少的资料,约35万份,以个人为单位分别存放,包括当事人亲属捐赠或寄放的日记、书信、草稿等私人文件。其中,在“电子展示会”(后述)上使用过的资料都陆续公开在网上。三是“日本占领相关资料”。这些关于“占领期”(1945—1951年美军占领统治时期)的美国公文与“宪政资料”一样,原件皆存放于“宪政资料室”。四是“博士论文”。在日本取得博士学位者,除授予学位的机构外,还有向国立国会图书馆提交博士论文的义务。1991年至2000年间的博士论文数字化工作目前均已完成。五是“历史之声”。历史之声档案协议会(HiRAC)将1900年代初至1950年代日本国内制作的唱片进行了数字化翻录,其中不仅有演奏,还包括演说及讲演。这些对于日本近现代史研究来说,都是实用性极高的文献门户网站。

曾经,不去国立国会图书馆便无法阅览、复印资料,如今只要登录“近代数字图书馆”便可在研究室或家里进行查阅。但“数字馆藏”仅在网上公开了著作权已被解禁的部分资料。而未在网上公开的资料中,也有许多可通过国立国会图书馆的东京总馆、关西馆、国际儿童图书馆三处或已加入数字化资料发送服务的图书馆(目前全国有600多所公共图书馆、大学图书馆加入)内配备的电脑进行阅览。

(三)“日本法令索引”

1867年大政奉还后,明治新政府取代幕府走向台前,标志日本的近代化开始起步。其后发布的一系列法令均能在网上检索到(5)。国会图书馆原本就是为了辅助国会议员的调查研究而设立的,建立与议会及立法相关的数据库也是理所当然的事情。在这里可以检索到提交给帝国议会、国会的各类法案以及提交给国会的各种议定条约等的审议经过。

虽未设英文网页,但检索功能齐全,可通过限定发布日期、发布主体、法令的种类等缩小检索范围,或显示相关法令一览表。检索系统分两种:一,为“明治前期篇”,可检索1867年10月大政奉还至1886年2月内阁施行“公文范式”期间的所有法令;二,可检索1886年2月至今的所有法令,以及省级以上法令的制定、修订与废除经过等信息。

由于“近代数字图书馆”或国立公文书馆的网站上皆标有链接,如已明确所需的法令名称,可直接上网阅览、打印法令全文。

(四)照片资料(“电子展示会”)

国会图书馆会利用馆藏资料在网上举办各种主题的“电子展示会”(6)。与使用实物资料的普通“展示会”不同,电子展示会的优势在于无须设定展会期限,可作为常设展示,常年公开。

目前,该馆已累积了20多项企划成果,其中最受日本近代史研究者欢迎的是“近代日本人肖像”展(7)。此展始于2004年,国会图书馆从其所藏的影集中挑选出政治家、官僚、军人、学者、实业家、新闻记者、社会活动家、宗教家、艺术家、文学家等著名人士的肖像进行复制,早期仅有220人,受到好评后进一步充实展品,现可看到超过600人的肖像,且附有简历和著作的链接,可灵活运用于课堂教学,并取得了不错的成效。

由于著作权问题早已得到解决,图像本身无须经过国会图书馆等存放单位的认可即可转载。

(五)报刊资料

受自由民权运动的影响,日本的新闻报纸很早就得以普及。除全国性的报纸之外,1880年代几乎所有的府县都创办了地方报纸。对近代史研究来说,报纸是不可或缺的史料。

国立国会图书馆(东京总馆)设有“报刊资料室”,来访者可通过缩微胶片阅览明治以后几乎所有的全国地方报纸。这些报纸既未被数字化,也未在网上公开,且无法通过所属机构或周边设施申请阅览,但就资料的特性及使用的频率来讲,这种做法是稳妥的。受时间及财力的限制,将所有的资料都转为数字化是不可能的。不用一次次前往偏远的府县,仅在国会图书馆一处即可检索、阅览、收集全国的报刊资料,已经算是便利的了。馆内还配备了可即时打印的机器,阅览缩微胶片时可随时打印已转换成PDF格式的数字化图像(每张15日元)。

此外,一些具有代表性的大报社也建立了数据库,提供明治以后自家报社编辑报道的图片或文字,如《朝日新闻》的“闻藏”、《读卖新闻》的“读出历史馆”、《每日新闻》的“每索”等。众多大学图书馆及公共图书馆都与之签订合约,并支付规定的费用,以便向使用者提供这些数据库。早前各大报社的过刊虽发行过再版合辑,但如今不必亲自去国会图书馆就能在周边图书馆轻松地进行检索与阅览了。

二、国立公文书馆

国立公文书馆(国立档案馆,National Archives of Japan)毗邻东京皇居,与国立国会图书馆相同,皆为主持数字化项目的国立机构。它设立于1971年,长期作为日汉古籍、古文书的存放机构为研究者提供服务。《公文书馆法》(1987)及《国立公文书馆法》(1999)规定,国立公文书馆有义务提供国家各机关收藏的公文的利用与保存等相关服务,从而强化了其承担将国民共同财产的公文传承后世的重要职能特征。近年,《有关公文等的管理法》(2011)出台,其中规定国立公文书馆有义务就行政文书的统一管理条例的制定、实施以及府省内的管理状况进行报告,并新设内阁府要求的实地调查及建议制度,愈加提升了其主导性。

(一)国立公文书馆数字档案

与国立国会图书馆相同,国立公文书馆也在急速推进收集资料的数字化工作。网上依次公开了由作为政府中枢的太政官(1869年8月)及之后的内阁(1885年12月成立)制定的主要资料群(《太政类典》《公文录》《公文类聚》《公文杂纂》),还提供馆藏重要文化财产的图像等信息的浏览(8),且配有阶梯形目录标签,检索功能相当完备,以致近20年来亲自前往国立公文书馆的必要性锐减。

(二)亚洲历史资料日本中心

2001年启动的“亚洲历史资料日本中心”(Japan Center for Asian Historical Records)隶属国立公文书馆,是负责将国家机关保管的“亚洲历史”,即“有关近现代日本与亚洲邻国关系发展史的重要公文”,建成数据库并在网上进行公开的机构,对日本近代史研究者来说是不可或缺的存在。其运营主体为国立公文书馆。

本文中所提及的“国家机关”目前有国立公文书馆、外务省外交史料馆、防卫厅防卫研究所三家。数字化工作由各机关独自承担,亚洲历史资料中心仅将所有资料集合在一起并配以检索功能进行公开。截至2014年4月,共公开了190万份、2 810万张图像。其对中国及韩国的研究者来说也助益甚多(9)

1.国立公文书馆部分

从国家机关移交过来的历史资料即重要公文中,择取与战前政策决定及执行过程、状况有关的部分进行公开。现已提供了上述《太政类典》《公文录》《公文类聚》《公文杂纂》等相关资料的名称摘录以及《御署名原本》《返还文书》等约32万份、670万张图像。

目前,国立公文书馆数字档案正与亚洲历史资料中心双向合作,推动《太政类典》《公文录》《公文类聚》《公文杂纂》的数字化进程。

2.外务省外交史料馆部分

“外务省记录”可谓外务省外交史料馆所藏资料的核心,现已编辑了自1869年外务省设立起到1945年第二次世界大战结束为止约80年间,外务省与各驻外使馆间的往来电报及公务信件等资料,约5万多册。“外务省记录”分“明治大正期”与“昭和战前期”两大板块,现已公开了约35万份、840万张图像,今后将按序进一步增加。

此外,外务省自1936年起开始着手编辑、出版《日本外交文书》,目前已达200册,并在续刊中。其作为近代日本外交史研究的基础资料,被广泛利用至今。外务省外交史料馆现如今正逐步将其数字化,通过其网站可随时进行阅览与打印(10)

3.防卫省防卫研究所部分

防卫省防卫研究所战史研究中心存放着1945年日本战败后被美军接收又被返还的史料和厚生省复员局等整理、保管的史料,以及战后防卫研究所为编撰战史、调查研究所收集或获赠的史料。陆军与海军等相关史料累计约有10万册。目前,《陆军省大日记类》(1868—1945)、《海军公文备考类》(1868—1937)等约123万份、1 300万张图像资料已在亚洲历史资料中心网站上公开,今后将按序进一步增加。

三、国文学研究资料馆

1972年设立的国文学研究资料馆(National Institute of Japanese Literature)也与历史研究息息相关。

目前,国立国会图书馆、国立公文书馆聘用的工作人员皆为公务员(普通职员),而国文学研究资料馆则聘用的是与大学教师同等身份的教授、副教授级专业人员。近30年来,此资料馆有关机构改革的议案几经反复,可以说是机构重组、迁移最为频繁且最具代表性的机构。当然这也是以资料为核心的研究机构无一例外都会面临的问题,其焦点就在于是把以资料为基础的“研究”放在首位,还是把资料的“公开”(数字化所衍生出来的庞大工作量与其他的专业技术)视为本职工作。

historian与archivist之间的界线原本非常模糊,但这波建设数据库的浪潮却使历史研究萌生了“historian与archivist分化”的现象。后者被要求具备特定的专业知识与技能,还确立了专门的资格审查制度。

眼下,国文学研究资料馆围绕机构改革引发的混乱局面已告一段落,在国立情报学研究所(11)的协助下,正致力于“国际共同研究网络的建设”。各种资料被收入数据库形成“电子资料馆”,还配以完备的检索功能(12)。其中最为著名的就是古代史、中世史和近代史研究者经常使用的《日本古籍综合目录数据库》,如今以明治以后的资料为中心的数据库也正在建设当中。

四、结语

本文主要介绍了三家国立机构参与数据库建设的概况,这些数据库均与日本近代史研究密切相关且最具代表性。当然,还有其他各类机构提供的不同种类的数据库。有关国立公立机构运营管理的数据库信息可查阅国立公文书馆网站上的链接(13)

此外,许多研究小组及企业也在尝试构建数据库。除了上述提到的报社充实新闻报道检索功能的情况之外,出版社也正在急速推进已出版图书的数据库建设。日本史研究领域广泛使用的基础辞典《国史大辞典》全17卷(吉川弘文馆)就是其中一例。当然,使用这些数据需另外付费。

对于作为受益者的历史研究者而言,即便领域不同或辈分有差,但可以说大家都享受着“大数据化”所带来的便利,处于如何将其与今后的研究相结合的摸索阶段。因此,笔者将就“大数据化”除便利性以外的问题,即“大数据化”难以解决的问题进行阐述,并以此作为总结。

“跨学科性的深化”是“大数据化”发展的衍生物之一。数据加工原本是电子信息类专业的研究者所从事的工作,但有关著作权或保护隐私权等问题出现时又离不开法律学者的协助。也就是说,“大数据化”具有集合不同领域研究的本质特征,所以在具体构建数据库时,需考虑到其不仅仅是面向“历史学者”,或是由“历史学者”提议,或是为了满足“历史学者”的需求,而是能够为多重领域的研究者所共同使用的网络平台。

比如说,2011年日本关东大地震发生后,国家行政机关对于灾害史的关注度随即增高,于是地质学者与日本研究近代以前史的学者共同发起了一个项目,构建了“(古代•中世)地震喷火资料数据库”(14)。不是提供资料的图像,而是从各类古代记录中找出相关的叙述,翻印成数据集。在这些设有特定主题的项目中,研究者不再是数据的“享受者”,而是数据的“架构者”,处于凭借其专业性思考构建实用系统的位置。在跨学科的领域里,需根据各种擅长与不擅长之处,或学术研究所需之处加以整合,然后在此基础上构建数据库。

然而直至20世纪90年代中期,大学历史学科的代表性观点仍是“历史论文得‘用足迹书写’”。“用足迹书写”即意味着需要“频繁前往资料收集地并不辞其劳”。受“用足迹书写”教育的老一辈研究者,面对如今将用电脑收集世界各地史料视为理所当然之事的年轻研究者时,常常投去复杂的目光并暗含嘲讽地说“遇上好时候咯”。曾经,浏览大量的资料并花费大量时间进行检索——比如罗列近代以前某位官员的官职补任经历,近代史中的相关新闻报道的收集等——这些工作本身都可以被算作学术“业绩”。然而,在只要简单地按下一个键电脑就能自动进行处理的今天,历史研究的“业绩”概念也起了巨大的变化,累积业绩难度日渐增大。为此也有人半是调侃半是羡慕地对专业研究者说“还是以前好啊”。

从这一点上看,“大数据化”改变了“用足迹书写”历史,即“花费劳力”从事历史研究的文化传统,但同时也有不变的地方。“field work(实地调查)”是历史学者最为重视的研究手法之一,可以亲身感受距离、地形、气候等“自然风土”,体味当地遗存的“风俗文化”。实地调查作为大数据化无法覆盖的历史研究方法将被传承下去。因此“用足迹书写”一词仍沿用至今,其中正是隐含了这层意思。仅依靠“信息”的历史研究,无实地查访的地域史研究总感觉像是在纸上谈兵。历史学研究是以复原过去的人们的实际生活为课题,仅凭“头脑”取得的“信息”是不足以为信的。这是一项需投入全身心去从事的学术事业,其所内含的特质今后也将会一直保留下去。

此外,文字资料不单单指书写的内容,笔迹与纸张也内含了其固有的史料价值。因此,即便有数字化图像提供,也不可能就无人申请阅览原件了。数据库对于资料保存者来说,在保护原件这一点上拥有巨大的优势,但今后随着自然科学研究领域年代测定技术水平的逐步提高,原件的固有价值或许也会得到相应的提升。


(1) 作者单位为京都大学。本文由上海大学朱虹翻译。

(2) http://kindai.ndl.go.jp/.另设英文网页。

(3) http://www.ndl.go.jp/jp/aboutus/digitization/index.html.另设英文和中文网页。

(4) http://dl.ndl.go.jp/?_lang=ja.另设英文网页。

(5) 参见http://hourei.ndl.go.jp/SearchSys/。

(6) 参见http://www.ndl.go.jp/jp/gallery/。

(7) 参见http://www.ndl.go.jp/portrait/index.html。另设英文网页。

(8) http://www.digital.archives.go.jp/.另设英文网页。

(9) http://www.jacar.go.jp/.另设英文和中文等网页。

(10) http://www.mofa.go.jp/mofaj/annai/honsho/shiryo/archives/mokuji.html.

(11) 本文未涉及国立情报学研究所的相关情况。日本所有领域的研究者在检索必要的图书、杂志及论文时经常参阅的网站CINII就是由此家研究所运营管理的。国立情报学研究所可以说是近二三十年来日本学术信息数据库的总部。

(12) 参见http://www.nijl.ac.jp/pages/database/。

(13) http://www.archives.go.jp/links/.其中一部分另设英文网页。

(14) http://sakuya.ed.shizuoka.ac.jp/erice/db/.