数字人文简史
1.起点:人文计算
从一开始,“人文计算就必须面对两种文化[16],用具有科学特征的严谨和系统明确的程序方法,解决迄今为止最常被偶然对待的人文学科中的问题”[17]。与许多其他跨学科的情况不同的是,人文计算的起源可以追溯到1949年。在这一年,意大利耶稣会神父罗伯托·布萨提出了一个想法:为在圣托马斯·阿奎那和相关作者的作品中出现的大约1 100万个中世纪拉丁语建立索引。他参观了IBM,希望电脑可以帮助他制作印刷卷宗。他得到了帮助和支持,在1974年出版第一卷。尽管之前出现过有些关于词频和作者风格定量研究的案例[18],但实际上只有计算机的出现才有可能更准确地进行类似研究。
在富有争议的作者研究中,首次使用计算机的是阿尔瓦·埃尔雷格(Alvar Ellegard),他在Junius Letters(一种计算机类型)上进行研究并于1962年出版[19]。在20世纪60年代早期,弗雷德里克·莫斯特勒(Frederick Mosteller)和戴维·华莱士(David L.Wallace)也试图确定联邦党人文集的作者身份[20]——他们的研究结果后来被认为是对作者身份研究新方法的一种考验——同时建立了在人文学科中使用计算机的研究中心。威斯比(Roy Wisbey)于1963年在剑桥大学建立了文学和语言计算中心,以便开展早期中高级德语文本的工作。威尔海姆(Wilhelm Ott)在图宾根大学围绕开发文本分析程序组织了一个小组。《计算机与人文学科》(Computers and the Humanities)杂志起源于1966年,由约瑟芬(Joseph Raben)担任编辑,成为传播人文计算信息的重要工具。霍基(Susan Hockey)告诉我们,在这个早期阶段的工作,往往会遇到各种关于新技术的问题。“这些早期研究人员发现,需要解决的关键问题在于关注超出图形字符串级别的单词,并有效地处理变体拼写,进行多部手稿和词形归并。”[21]
霍基认为,20世纪70年代到80年代中期可能是一个巩固时期。更多人采用20世纪60年代早期开创的方法。1970年剑桥大学召开了一次研讨会,从而开创了英国两年一度的系列会议,这一系列定期会议使得信息进一步传播。这些成为人文学科计算的主要焦点。这些会议以及其他活动中的论文需要一个出版渠道——这是1973年伦敦国王学院的一次会议创建《文学和语言计算协会公报》的原因之一。同时,美国也举办了一系列会议。随着这些会议逐渐为人所知,国际人文学科计算会议(ICCH)与英国的会议交替进行。他们提供了更广泛的主题范围——包括计算机在教学和写作以及音乐、艺术、考古学中的应用,并在1978年发展为“计算机和人文学协会”。“浏览这一时期的各种出版物就会发现,基于最初索引程序产生的词汇研究的论文占大多数。”霍基写道:“结果确实如此,风格分析或语言应用更受欢迎,复杂的数学运用于词汇计量,而人文倾向的学者受到冷遇。”[22]
20世纪80年代中期到90年代初期,许多最重要的发展都源于两种新技术的出现,即个人计算机和电子邮件。霍基解释说,一些重要的发展得以实现,部分原因在于这一时期计算机使用量的增加,部分是由于减少了重复工作。到20世纪80年代中期,许多国际发送和接收电子邮件的设备都已到位。人文学科的第一个电子邮件列表Ansaxnet成立于1986年。次年,“人文主义者”讨论组创立,它一直是维护人文计算社区的核心,并且已成为其他电子邮件列表的典范。在智力发展方面,霍基认为,一个特别突出的事件是:文本编码倡议(TEI)《电子文本编码和交换指南》的发展。1994年5月,第一个完整版本出现,TEI内部的工作使人们对将人文学科作为主题的信息和知识产生兴趣。此外,“TEI指南”的出版“与全文数字图书馆的发展恰好同步,对以前未接触过人文计算的数字图书馆项目而言,将其工作基于TEI而不是从零开发方案是很自然的”[23]。
互联网起源于1983年。随着20世纪90年代初万维网的到来,一批新用户出现了——这些用户发现任何人都可以在网上发布并宣传他们的活动,既可以个人的名义,也可以与他人合作。文件大小没有限制,格式也不再仅仅是印刷书籍的格式,超文本链接为用户提供了一种简单的方法。处理注释和参考文献,并且随着事情发展同步进行准备、修改和更新,内容可以立即零星发布——这还仅仅是从信息生产者角度而言的优势。20世纪90年代早期,以图像、音频和视频的形式增添多媒体信息的可能性进一步增大,人文计算中的其他以及更理论化的领域也随之涌现。其中之一就是书籍和其他类型的文化遗产的数字化,不仅针对学术用户,也针对公众。因此霍基写道:
电子资源本身成为研究的对象,并由新的学者进行分析,其中一些学者对资源的技术方面缺乏经验。超文本吸引了许多理论家。这有助于扩大对人文计算的兴趣和讨论范围,但也可能导致对构建和使用此类资源实际涉及的内容的误解。“两种文化”[24]的问题再次出现,其中一种实际上是这样做的,另一种更倾向于谈论这样做。[25]
2.从人文计算到数字人文
有些学者在研究传统人文对象(技术锚定和基于工具的方法)的过程中使用和开发数字技术,也有一些学者则以相反的方式,即从数字对象和计算技术本身中提出传统的人文倾向的问题(文化或媒体研究导向的方法)。霍基提出了这两种学者之间的紧张关系。这种紧张局势是从“人文计算”到“数字人文”之间松散转变的结果,霍基对此并不完全满意。正如菲茨帕特里克所看到的那样,这只是“理论与实践鸿沟的更新版本,在人文学科的其他方面也长期存在”,但与一些有效的方法弥合。这样的方式并不欢迎所有在人文学术领域中具有数字元素的学术研究都加入数字人文的行列。有些学者虽然专注于各种数字材料,却不能够直接在数字人文学科的传统和假设范围内工作。关于是否属于数字人文学科这一学科边界的争论,本身就是富有成效的,但是,
数字人文学科的现状在于创造性的紧张关系,即那些长期从事该领域的人与刚来到这一领域的人之间,在学科与跨学科之间,在制作与解释之间,在该领域的历史与未来之间的紧张关系。与所有学术领域一样,人文学科的学术著作越来越多地以数字方式完成。然而,数字人文学科的特殊贡献在于探索数字技术能对我们从事的工作和沟通方式带来的影响。[26]
在此基础上,菲茨帕特里克对数字人文提供了一个相对清晰有用的定义:“学者利用计算技术研究人文学科传统问题的领域之间的联系……”[27]