社会科学的幻象

五、社会科学的幻象

奥尔森在《计算机与人文》杂志上写作,自然倾向于讲述一个以人文主义者和计算机为中心的故事。他承认社会科学的相关性,但没有对其方法进行展望。对于远读中的许多当代作品,也可以这么说。最好的远读者实际上是把他们的项目当作实验来对待的。(我们不会漫无目的地数东西。)但我们的研究的实验结构并不总是在我们写出来出版的时候。以社会科学的方式(方法,然后是结果,然后是结论)组织的一篇文章可能不会受到文学评论家的热烈欢迎,他们习惯了修辞风格。更有效的做法是假装你的工作是以一种随意地脱口而出、由类似的驱动方式成长的,然后恰好用你做的一些散点图来说明。

我和任何人一样对摆出这种随意的姿势感到内疚。这往往是不可避免的。我曾建议,远读者致力于打造一个适合历史学科的科学方法版本。但我们也是文学评论家,评论家有义务变得有趣。这意味着我们有时不得不将方法塞到附录中,或者让分析任务看起来比实际情况更容易一些[40]。总的来说,我接受这种修辞上的双重束缚,因为我们位于一个棘手的学科边界上。但它确实有掩盖为项目提供动力的引擎的副作用。读者可以看到为什么广泛的历史问题很重要,他们也可以看到计算机的作用。但明确实验方法的价值很难分辨:远读者有动力淡化我们工作的这一部分。然而,研究问题的实验框架确实是这一领域的关键。一方面,贾尼斯·拉德威的量化方法仍然可以做伟大的工作,这些方法只需要纸和铅笔。另一方面,如果不模仿拉德威对假设、样本和结果的明确,就很难大规模地进行社会研究。

不幸的是,社会科学方法论并不是数字人文学科的核心话题,也不是数字人文标题下的远读形式的核心话题[41]。安德鲁·戈德斯通的“阅读”一词本身促成了社会科学的融合[42],这是正确的。但最近将远读视为数字人文学科的一个子领域的倾向也可能起到一定的作用。数字人文术语将知识生活作为人文主义者与机器之间的对话展开。它没有明确地指出实验方法的前景,而是强调了人文科学与社会科学之间的界限。

这就是为什么我写了这篇文章——来梳理远读背后被回避的社会科学谱系。还有其他可以追踪的线索。例如,正如我所承认的,机器学习正在对当代场景产生强大的影响。我不想贬低任何子领域,但我确实想坚持认为,远读的谱系应该通过厘清其中心思想动机来追踪,而不仅仅是越远越好地遵循计算机与文本研究之间的交叉区域。罗伯特·布萨(Roberto Busa)与阿奎那(Aquinas)的一致是一件有价值的事情,但一个作者的和谐并不构成远读的重要起源时刻。如果我们想追溯这一传统到20世纪中期,我们就需要在几个不同的方向上遵循不同的思路。我们最终可能会问雷蒙德·威廉斯在20世纪50年代末对文学做了什么,克劳德·莱维-施特劳斯在研究社会人类学的同时在做什么,弗兰克·罗森布拉特(Frank Rosenblatt)在用感知器做什么。

诚然,在21世纪,这些学科故事趋于趋同和融合。这带来了一个令人兴奋的挑战,但也是研究生培训的一个问题。准备做远读者的学者可能需要与编程、社会理论和统计有一些接触,以及对文学历史传统有相当深入的了解。现在,被称为“数字人文学科”的灵活跨学科共同体可能是学生尝试将这些准备模式结合起来的最佳发源地。

但如果这两个项目要在一个屋檐下共存,它们之间的差异就需要坦诚地讨论。一方面,数字人文主义者不一定认同远读者对社会科学的钦佩之情。相反,他们往往关心在定量社会科学与人道反思之间建立界限[43]。如果数字人文是统一的,它是统一的对数字技术的反思,这种情绪的范围包括从好玩的探索到监测批评。另一方面,远读者不关注技术。他们以社会科学方法为中心研究文学的过去。这种紧张局势造成了一场可以预见的冲突,这种冲突已经展开。数字人文的入门课程和工作坊很少教导学生他们需要知道用来练习远读的知识。因此,远读者将不得不鼓动另一种更加强调定量方法的课程。这种煽动已经在进行中[44],但在以形容词数字为框架的对话中,它很容易被误解为试图以更技术性的方式推动数字人文方向。例如,远读者对广泛的历史问题的兴趣——至少可以追溯到雷蒙德·威廉斯——被广泛地与最近的技术流行语大数据混为一谈。这种冲突可能开始造成一场无果而终的辩论。辩论各方未能理解分歧的原因,因为它们误解了彼此的真实立场和承诺。

本文试图澄清定义了远读的协议。我的目的并不是要达成共识。我知道这里引用的许多学者会不同意我对这一领域的定义。特别是,我知道许多学者与数字人文和远读都有着密切的联系。我期望做这两件事的人都会抵制这样的结论,即这些是智力上不同的知识项目。当然,这些项目目前是融合在一起的,其方式对人类学术来说是非常重要的。例如,招聘广告通常需要“数字人文主义者”——几乎从来没有为“远读者”提供过职位。因此,初级学者务实地将这两个术语分开是不明智的,对当代社会场景的纯粹描述很可能将它们结合在一起。本文将数字工具与实验方法分开,其原因并不纯粹是务实的或描述性的。我试图在谱系的叙述中消除分离,但我也要承认,它有一个前瞻性的规定性目的。

在过去15年里,随着远读者抓住技术机会,该项目的目标变得分散。通常我们的近期目标确实是探索性的:“让我们看看这些工具能做些什么。”这次探索是富有成效的,但我认为这个领域已经做好了探索过去的准备。大规模的文学史现在可以围绕明确的研究问题进行重组,并严格推进我们对过去的了解。但为了做到这一点,我认为我们需要把对技术的迷恋放在一边,重新发现实验的指导原则。我通过指出这一领域的历史,特别是社会科学在威廉斯·拉德威和莫雷蒂研究中的重要性,为这一观点进行辩护。但这最终也是一种观点。这篇文章只提供了一种远读的谱系。我期待着阅读其他版本的故事。