互联网上的气泡
在创始之初,互联网被看作为跨国界跨语言自由交流提供了一个的公共空间。在这个“平等的”世界里,人与人之间的等级与隔阂消失了,每个人都相互平等地发表意见,可以接触到世界上其他角落的知识与文化。然而互联网平台还发展出无数种小而专门化的社区。无论民族主义者,明星脑残粉,还是科学爱好者,都可以轻而易举的找到与自己志趣相投的朋友。不仅于此,互联网技术还发展处用户化个性化服务,比如产品推荐系统,内容过滤,好友推荐,标签分类等,用户始终暴露于符合自己独特口味的内容里,而这些“小圈子”带来的并非开放的思想和自由的表达,恰恰相反,他们成了一个个“气泡”。“气泡”把新的,奇怪的,对立的想法排除在外。这些“气泡”就如同我们计算机仿真里的“孤岛”,或音乐实验室中的“宇宙”,“气泡”中的人的行为,态度与观念变得一致,变得极端,有时甚至会仇视气泡外的人。也许你会认为大学教授或人民日报有着话语权威,那么对于小众团体或次文化团体(subculture groups)来说,那是异端。他们的言论非但不会影响“气泡”中的人,可能会起到反作用。
在这里,我要介绍一项我的关于类似“气泡”的工作。科学长久以来被认为是公平的和超然的,不受意识形态影响的公共空间。科学家,作为科学的从业者,在有AAAS和皮尤研究中心做的多项民意调查中,都处于民众最为尊重的职业。然而在美国的两极化的政治环境下,科学也难免于不同意识形态势力地侵蚀,特别是保守势力为主的共和党经常公开置疑甚至非难许多科学思想和成果,其中对于进化论,干细胞,温室效应的研究持否定和打压态度。2013年左右,共和党主导的科学,空间和技术委员会向国会提案建议削减对美国国家自然科学基金近百分之五十的经费。美国综合社会调查也显示保守主义的受访者对于科学的信任逐年递减。为了检验科学是超然的(脱离意识形态)和公平的(左右平衡),我与合作者(见延伸阅读Shi et al. 2017)希望利用亚马逊的书籍共购买来看看科学书籍的读者是否存活在他们的“政治气泡”中。
如果你在亚马逊(或任何一家电子购物网站)上购买过商品,你会经常看到顾客同购买推荐:购买该商品的顾客也购买了这些商品(Customers Bought This Item Also Bought)。亚马逊的同购买推荐是基于协同过滤算法。简单的说,如果两件商品有很多共同的消费者,这两件商品之间一定存在某种共同性,那么当你浏览一件商品的时候,亚马逊即会将其他与其相似的商品推荐给你。而这些推荐表面上看似乎给了消费者更多他们会喜欢的选择,但实质上构造了一个“气泡”,大大地限制了我们探索新商品的机会。值得指出的是,同购买推荐是根据消费者的实际行为算出。这些购买行为是昂贵的,自发的,私密的,相较于调查问卷,它们更真实地反映出人的想法。试想,当你问及意识形态上敏感的问题是,你是否会如实的说出心中真实的,却并不高尚的想法呢?
2013年初,我们用网络爬虫从两本种子图书开始(奥巴马的《Dreams from My Father》与罗姆尼的《No Apology》),收集与他们同购买的所有图书。然后以这些图书为种子,去收集与他们同购买的书。这样一层一层地直到爬虫穷尽了所有亚马逊上包含在最大的相连子网络中的图书。这样的话,我们就等到了一张由书为节点,由同购买为边的巨大网络。复杂网络的一个重要特性是就是若网络的密度(简单视为边与节点数的比)不是太小的话,那么绝大部分节点都能落在最大的相连子网络中。这张图书同购买网络包含了一百三十余万本书和两千六百余万条同购买推荐。首先,在这些书中,我们找出了在亚马逊图书分类为保守与自由主义中的3500余本图书,请了两位独立的本科生将其按照意识形态分为保守主义,自由主义,与其他这三类。若编码中出现分歧,我们雇佣了第三位学生作为仲裁者。最终我们得到了673本保守主义(“红色”)图书和583本自由主义(“蓝色”)图书,并将剩余其他类图书舍弃。图3-3则展示了这一千四百多本意识形态类书籍的共购买网络的可视化。令我们兴奋的是,节点的颜色(由我们的学生独立编码而得)与节点的网络位置(由力导引布局算法产生)几乎完全一致!一方面,可视化给出了政治极端化的有力证据:自由(保守)主义倾向的读者会同时经常购买不同的自由(保守)主义书籍。另一方面是对我们意识形态图书编码的肯定。我们的下一步工作即利用科学类书籍与这些意识形态书籍之间的强弱关系来推测购买不同学科图书的用户的政治倾向。
我们利用国会图书馆的分类系统对亚马逊上的图书进行学科上的分类,得到总共42万余本科技类图书,4个学科大类(人文,物理科学,生命科学,与社会科学),和27个学科门类。除此之外,我们还将剩余非科学类书籍分成四大类:艺术,体育,文学,和宗教。在图三的右图中,我们用灰色节点表示科学书籍,把所有科学书籍的同购买网络用特殊的网络布局算法可视化出来。这样,同一或相近学科的书籍就会在可视化中相对靠近,而差别较大的学科则会相互排斥。我们把与科学书籍同购买的意识形态书籍也用同样的布局算法画到了网络中(当然这里的所有意识形态书籍之间的同购买连接已被去除,保留地仅是科学与意识形态书籍之间的同购买连接)。我们可以清晰地看出,红色的保守主义与蓝色的自由主义书籍并未广泛的分散在科学书籍的网络上,相反,他们集中分布在网络的不同位置,且各自抱团。相对于占据科学网络中央位置的的自由主义书籍,保守主义书籍更多的处于边缘,而且与他们接触的科学书籍相对较少。

图4-3 图书同购买网络
图注:意识形态图书(左)与所有科技类图书(右)的同购买网络。其中节点为图书,连边为同购买推荐。红色节点为保守主义图书,蓝色节点为自由主义图书,而灰色节点为科技类图书。
为了完整的描述科学与意识形态的关系,我们设计出了三种测量:政治关联(Political relevance),政治取向(Political alignment),以及政治极化程度(Political polarization)。简单地讲,政治关联描述科学与政治的远近(不分左右意识形态)。若科学书籍经常与政治书籍被相同的读者购买(比如经济学),那该学科则政治关联强;而若科学书籍极少与政治书籍同购买(比如数学),那其政治关联弱。政治取向定义为某一学科的读者更多选择保守主义还是自由主义的书籍。注意某一学科在政治取向上极端偏左或右,但在政治关联上非常弱;也可能政治关联性高,但左右平衡。政治极化程度用来测量某一学科内部的分化程度。比如经济学中有反对国家干预的新自由主义学派和提倡宏观调控的凯恩斯学派。那么,表面上看上去左右平衡的学科,其内部的读者是否意见分歧,只阅读属于他们世界的图书呢?由于没有读者层面上的购书记录,三个测量都以同购买网络为基础。
研究发现,相对于一般读者,购买科学书籍的读者更愿意购买政治类书籍,而科学与政治书籍之间较高关联主要取决于社会科学,而生命与物理科学与政治关联较弱。科学作为整体并未显示的政治取向,但大部分学科均有不同程度的意识形态倾向。比如气候学,历史,医药,有机化学,计算机工程等学科偏向保守主义,而动物学,哲学,人类学,生态学,天文学等均明显的偏向自由主义。似乎越偏向抽象理论的学科越接近自由主义,而与保守主义接近的学科则大部分为面向工程应用。我们进一步将不同学科与专利数据库关联起来,分析结果确实验证这一观察:申请专利较多的学科更倾向于保守主义;而那些实际应用价值不高的学科,如抽象数学,现代物理,动物学等,则大都偏向自由主义。
而有些学科从表面上看左右平衡,但如果把内部同购买网络放大,我们却会发现完全不同的景象。环境科学则是一个极好例子(如图:4-4)。图中每个灰色节点代表一本环境科学的书,而红蓝节点为与其同购买的意识形态书籍。其中自由主义书籍相对均匀地分布在网络上,且每本都与若干本不同的科学书籍相连;而保守主义书籍则聚集在网络的边缘,且绝大不大部分都与极少数的环境科学书籍同购买。我们特意地找来那些与意识形态同购买的环境科学书籍。与自由主义同购买的科学书籍大都与传统的环境科学相关,而与保守主义同购买的科学书籍则大都有着浓厚的意识形态,但往往打着科学的旗号,比如《Eco-Fads》,《The Skeptical Environmentalist》,《How the EPA's Green Tyranny is Stifling America》等。试想,如果读者在亚马逊上浏览书籍是误入这个由保守主义与伪环境科学书籍组成的集团,那试图通过亚马逊给出的推荐来跳出这“政治气泡”的可能性微乎及微。

图4-4 环境科学的同购买网络
图注:灰色节点为环境科学书籍,而红色与蓝色节点为与科学书籍通购买的意识形态书籍。