政府数据库
我们生活在大数据时代——一个蕴藏着巨大机遇但也存在着各种各样问题的时代。随着数据的丰富,政府迫切需要收集并利用各类信息。只需收集信息就可以消除犯罪,甚至消灭恐怖主义,还有什么比这更好呢?这种美好愿望常常使我们对大规模数据窃取所带来的真正困难和威胁视而不见。
在评估数据对警察执法的价值时,必须警惕执法部门错误使用数据库而导致将目标锁定完全无辜的人;政府和相关人员将为此类错误付出代价。
然而,具有讽刺意味的是,即使信息收集过程毫无问题,数据的使用符合预期方案,政府大量收集个人数据的行为也会影响到我们每一个人。这是因为,大量数据收集的目的,是让政府为尽可能多的人建立个人档案,其理论依据是,一旦对累积的数据进行分析,犯罪分子自然浮出水面。为了让系统正常工作,无论人们是无辜的还是有罪的,政府需要访问每个人的数据,以便找到一个可以揪出不法分子的数据模型。实际上,这意味着政府正在建立我们个人信息的庞大数据库。我们被迫放弃了自己的隐私和安全,应该引起我们的重视。
为了保护所有人的安全,不遗余力地收集大量数据利弊参半,取决于数据收集计划如何被采用和实施。诀窍在于运用民主和宪法的原则,最大限度地利用数据库,同时尽量减少对公民自由和隐私的威胁。虽然这很重要,但这根本不是政府目前正在做的事情。
数据库的危险
认识一下亚伯·马沙尔——一个普通的中西部人。身材高大,沉默寡言,长着一张娃娃脸,留着山羊胡。2010年4月20日,马沙尔至芝加哥奥黑尔机场乘机,前往斯波坎训练一位客户的宠物狗。不过,这次旅行从一开始就不顺利。马沙尔出发前一天晚上试图在网上办理登机手续,但被告知必须在机场票务处办理。因此,第二天他早早地来到了奥黑尔机场,尽管面临着要把庞大的身躯挤进窄小的飞机座位上,他仍然急切地想成为西南航空的第一组登机的旅客。机场票务人员把他的名字输入电脑,给了他一个“很奇怪的眼神”,然后转身消失在身后的办公室。几分钟后,马绍尔被大约30名来自芝加哥警察和运输安全管理局的警察包围了。1
这时机场工作人员告诉他,他在禁飞名单上。2
马沙尔以为这一定是个玩笑,“大误会”。当被告知需要接受联邦调查局的询问时,他暂时同意了。“我会到里面回答你的问题,但我有一个要求。”“是什么?”他们问。“不要使用水刑!”听到这句话的每个人都竭力装出一副板着脸的样子,可许多人还是忍不住窃笑起来。3
马沙尔一贯如此,擅长搞笑。那天发生在奥黑尔机场的事件对他和家人来说都是一场巨大的考验;其间马沙尔写了一本自传,回顾了他的生活及发生在他身上的趣事,对于一位新手作家来说,这本书是相当不错的读物。在书中,他不厌其烦地详细描述了学生时期一路走来的各种恶作剧、寻开心,从没有认真对待任何事情——堪称完美的“班级小丑”。如有几次他打开事先准备好的饮料瓶,让液体顺着教学楼楼梯旋转而下,一些倒霉的人被溅了一身牛奶甚至尿液,惹得同学们哈哈大笑。恶作剧一直持续到他突然被抓,为了免于被学校开除,他接受了30天保洁工作的惩罚,和那些曾被他捉弄过的同学一起工作。不过,在被同学欺负了几天之后,他们都成了好朋友。4
离开学校后,马沙尔改过自新,决定进入执法部门,成为联邦调查局或特勤局探员。这些工作很难应聘成功,但负责面试他的招聘人员为他指出了一条光明之路。马沙尔接受了建议,直到今天,这份工作对他来说都是一种非凡的人生成就。5
马沙尔参加了海军陆战队。他成功通过新兵训练,结婚,有了一个孩子(4个孩子中的第一个),获得大学学位,成为一位神枪手、射击教练和警犬训练师,还经营了一家办公用品商店。然后他离开部队,决定不再加入执法部门——部队里的坏上司已足够多了,他知道他想为自己工作——于是成为一名私人驯犬师。他还和其他一些人一起创办了一个公益性组织,为有需要的退伍军人训练和提供服务犬。“永远忠诚的服务犬。”永远忠诚,那是亚伯。6
他就站在航站楼里,被执法人员包围着,“拿着我的海军陆战队行李包和海军陆战队的T恤衫,被告知我在禁飞名单上。”7
几个月后,尽管做了很多努力,包括填写政府提供的赔偿表格,马沙尔还是未能将自己从禁飞名单上除名,因此他也是美国公民自由联盟对国土安全部提起诉讼的一部分。这起诉讼对禁飞名单运作方式的合宪性提出质疑。马沙尔是几名原告之一,他们有些原告是退伍军人。8
美国公民自由联盟禁飞案的原告还有一些其他的共同点:都是穆斯林,或者阿拉伯后裔。马沙尔两者兼而有之。他的全名是易卜拉海姆·马沙尔,尽管他一直被称为亚伯。血统中一半是巴勒斯坦阿拉伯人,一半是意大利人。第一代来自父亲一方,第二代来自母亲一方。一个带有移民血统的美国人,和许多人一样。马沙尔的书名叫《无间谍无苍蝇》(“No Spy No Fly”),因为联邦调查局提出,如果他愿意为他们监视清真寺,就把他从名单上除名。这显然已经发生了很多次,政府利用禁飞名单来招募间谍。9
直到今天,马沙尔都不明白他怎么会出现在禁飞名单上。他并不是特别虔诚的教徒。在他成长的过程中,他的父亲曾一度把他送进宗教学校,但并没有持续太久。他想知道是不是因为,曾有一段短暂的悲伤时期,他寻求宗教慰藉,给一位伊玛目写信,询问如何用两种信仰抚养孩子。(他一退役,父亲离世,妻子在第二个孩子出生前8周流产了,他的一个好朋友驾驶摩托车发生了致命车祸。)他在书中写道,他“感到有些懵,不知道这些观察名单已经变得多么糟糕,不知道有多少无辜的人受到了影响”。这些“听起来不像是美国”。10
欢迎来到马沙尔的世界——也即将是我们所有人都要面对的世界。我们生活在一个充斥着大量政府数据库的时代,这些数据库记录着人们的衣食住行。根据长期实施的“安全飞行”计划,运输安全管理局根据“恐怖分子观察名单”对照检查乘客的“姓名、性别和出生日期”。2013年,运输安全管理局宣布将扩大对乘客的筛查范围,收集财产所有权、身体特征、情报和执法数据、税号、旅行史和预订记录。人们的信息被分发给各州、地方甚至外国政府,或“与安全或旅行无关的私人公司”。那些被指控(无论对错)违反运输安全管理局规定的人发现,自己可能成为私人追债公司的讨债对象。11
在这个充斥着政府数据库的新世界里,一旦被机器困住,就很难把事情调查清楚。已故参议员爱德华·肯尼迪发现自己被列入禁飞名单。他在登机前曾多次被拦下,或被要求接受额外检查,他的工作人员联系了运输安全管理局总部。花了3个多星期才把他从名单上除名。肯尼迪利用听证会质问国土安全部副部长阿萨·哈奇森:“如果国会议员都有这种困难,那么陷入这件事的普通美国人如何能够……得到公平的对待,而他们的权利不会被侵犯?”这个问题很尖锐,直到今天政府仍没有做出确切的答复。12
当数据库程序按照预期运行时,对我们自由的威胁可能比数据库出错更大。政府在收集大量个人信息方面神通广大。自己无法收集的,就从私人供应商那里购买。在约翰逊和福特时代,“连接政府数据库”的建议遭到了公众的抗议。现在即使已经连接上我们都不知道。在谈到运输安全管理局的努力时,电子隐私信息中心的一名律师说:“一般人都不知道有多少智能驱动的匹配正在进行,以及这些匹配如何被利用用于其他目的。”13
政府使用大数据来监控公民,很可能是21世纪普通美国人在个人隐私和安全方面面临的最大问题。然而,我们对它知之甚少,也百思不解。困难在于,正如这位电子隐私信息中心的律师告诉《纽约时报》的,所有这些数据收集和数据匹配都是在“没有实质性的监督、透明化或问责制”的情况下进行的。虽然有一些法规管理隐私和数据共享,但大多数法规都会存在执法例外,在我们最需要保护的时候反而放弃了对我们的保护。14
当涉及出于执法目的而使用私人数据时,政府几乎不停地在收集新的数据。对任何卷入这一切的人来说,后果令人震惊。每个人的信息被不停地收集,并未得到本人许可。数据库系统创建之前要对其进行民主授权,整个过程的操作需保持透明,并对现有的程序从宪法的角度进行适当分析。然而,这些最基本的保护措施却经常缺失。
数据的兴起
数据库已经存在了很长一段时间,但将存储在文件柜里的潦草笔记的“过去”与大数据的“现在”进行比较,就像哥白尼利用金属管观测星空与哈勃望远镜观测星空的区别一样。以联邦调查局神奇的指纹识别能力为例。该项目于1924年启动。这个数据库虽然有早期卡片分类器的支持,但基本依靠人工搜索。直到1985年,联邦调查局的“自动指纹识别系统”(the Bureau's Automated Fingerprint Identification System ,BAFIS)将曾经需要数千小时才能完成的工作在几分钟内完成。随后,1999年,数据库改由数字技术支持,并更名为“综合自动指纹识别系统”(the Integrated Automatic Fingerprint Identification System , IAFIS)。2014年,联邦调查局宣布IAFIS即将被淘汰;NGI——“下一代信息系统”(Next Generation Information)已“全面运行”,将1.8万多个州、地方和联邦警力连接在一起,实时共享数据。今天,该系统在几分钟内就可以比较成百上千万的犯罪记录和平民记录,以及头像、疤痕和文身以及化名等身体特征。15
数据库革命由三个因素驱动:数据的激增,计算机速度的指数级提高,以及微型化和存储能力的飞速发展。今天,英特尔的芯片比1971年生产的第一块芯片速度快数千倍,价钱便宜数万倍。英特尔现任首席执行官布莱恩·克扎尼奇观察到,如果1971年的大众甲壳虫遵循同样的轨迹,那么今天它将以每小时30万英里的速度行驶,每加仑汽油行驶200万英里。数据存储也是如此。一项估计说,世界上90%的数据是在过去两年中创建的;类似的预测是,到2020年,存储的数据量将每两年翻一番。你可以把国会图书馆的全部印刷藏品放在一个不超过手掌心大的硬盘上。16
在这项技术的帮助下,执法部门的数据库不仅非常庞大,而且还在不断增长。国家犯罪信息中心目前拥有1300多万份记录,从枪支管理背景调查、被盗车牌,再到性犯罪者。2015年6月的某一天,它就回答了1450多万个查询。还有恐怖主义数据库。国家反恐中心的恐怖主义身份数据智能环境(TIDE)——情报机构的中央数据库——已经扩张到超过100万个名字,其中包括大约2.5万名美国永久居民和市民。每天晚上都有1000个或更多的新名字及其信息涌入联邦调查局的恐怖分子甄别中心,在那里,分析员开始决定谁最终会被列入观察名单。17
但是,不仅仅是罪犯和恐怖主义嫌疑人——每个人都在政府的数据库里。政府有我们的税收数据、拥有房产的历史、汽车登记记录,以及就业数据。它可以记录人们的身体特征、旅行活动,甚至可以保存以前与政府打交道过程中收集到的信息,比如某人在机场安检处被拦下接受特别检查时带了什么书。它保存着人们的情报和安全档案。国土安全部通过一个“自动锁定目标系统”(Automated Targeting System),汇集了“机密、不可查看、由政府保存了40年”的不同数据概况,对每个出入境人员进行恐怖主义风险统计评估。18
最雄心勃勃的政府数据收集工作之一是“融合中心”(fusion centers),它允许州、地方和部落政府执法机构将资源和信息结合起来——表面上是为了防止恐怖活动。“911”事件委员会将政府官员未能分享威胁信息列为2001年恐怖袭击的主要原因之后,由联邦基金创立了这些机构。2006年10月,美国国家情报局局长约翰·内格罗蓬特在联邦调查局国家学院发表讲话时解释说:“联邦政府不可能——也不应该——时时刻刻对各个地方进行监视。”相反,“各州和各个地方的同事是我们分布在全国的眼睛和耳朵”。19
尽管最初是为了反恐而设立的,但大多数“融合中心”的任务很快就演变成了更广泛的内容:“所有危险,所有犯罪,所有威胁。”所有的一切。这并不出人意料。正如萨克拉门托负责一项国土安全部研究的警官所指出的那样,“没有足够纯粹的‘恐怖主义’活动可以支持一个专门处理恐怖主义活动的多司法管辖区、多政府级别的融合中心”。他指出,分析家们会感到厌烦,他们的“技能会萎缩”。所以融合中心人员的关注点已经远远偏出了恐怖主义方向。他们广泛地分享他们收集到的信息:学校、许可证发放机构、儿童保育企业、运输服务,甚至私营部门。20
公民信息被“融合”的数量惊人。特拉华州巡逻队队长比尔·哈里斯是特拉华州信息和分析中心的负责人,他解释说:“融合的过程是从农业部、交通部获取执法信息和其他信息,私营部门将其融合在一起,寻找异常情况,并将信息传递给我们在特拉华州的利益相关者,他们既有权利也有必要知道。”“我不想说这是无限的,但上限非常高。”罗德岛州巡防队副指挥强调,“永远没有足够的信息……这就是“911”事件后的情况”。21
进入融合中心数据库的一个关键数据入口是“可疑活动报告”(suspicious activity reports, SARs)。巡逻的警察和普通市民被告知,如果有什么不对劲,就要提供线索。这些报告被输入国家“信息共享环境”。“可疑活动报告”直接进入共享系统,无须是具有怀疑理由的违法犯罪活动;许多无辜的行为也会让你进入数据库。洛杉矶警察局列出了65项可以上报的“外国或国内恐怖主义”活动,包括“使用双筒望远镜”“绘制图表”“支持极端主义观点”和“拍摄没有明显美学价值的照片或录像带”。(再读一遍最后一条)22
如果政府无法收集你的信息,那么它可以买到。像“选择点”(Choicepoint)和艾克西姆(Acxiom)这样的私人供应商通过收集和捆绑私人数据出售给政府赚了一大笔钱。(“选择点”于2008年被里德·爱思唯尔以36亿美元收购;该公司以前是一家教育出版商,最近更名为RELX集团,通过为风险管理提供信息而大赚一笔。)这些公司还为政府提供信息分析。例如,雷神公司(the Raytheon)推出了一款名为“暴动”(Rapid Information Overlay Technology, RIOT)的“极端规模分析”项目,该项目旨在利用快速信息叠加技术,使政府能够创建一幅人们生活的文字地图。“暴动”从社交媒体上提取嵌入位置信息的照片,创建图表,显示你将去哪里,什么时候去,同时还绘制人与人之间的关系图。有一个宣传视频,你可以看到雷神公司跟踪自己的一名员工(“所以现在我们知道尼克去了哪里,现在我们知道尼克长什么样了……”)。23
执法部门所有的努力,不论是积极主动,还是以威慑为主,其真正的目的是进行数据的挖掘——即尝试从公共和私人来源收集的所有数据中识别固定的模型。执法部门用于数据挖掘的程序不胜枚举,且数量持续在增长。Intrado公司出售给执法部门的软件程序“当心”(Beware)集成了“数十亿公开的商业记录”,可以在几秒钟内为警方的首批处警人员提供“危险评分、事件摘要和‘注意’声明”。例如,确定一个特定的地址,“当心”可以提供在该地点登记的汽车,以及居民的电话号码和犯罪记录;它还可以搜索社交媒体内容和网上购物记录,以确定警官即将面临的风险等级。24
现在,在各级政府中,“预测性警务”风靡一时。警方正在使用名为PredPol和HunchLab的软件程序,试图确定即将发生的犯罪地点。一位与芝加哥警察局合作的教授说:“综观全局,你开始了解某个区域的异常意味着什么。”(经过一段时间警务数据程序的研究,你就会发现“异常”这个词被大量使用。)由于热心企业合作伙伴所提供的技术支持,全国各地出现了对这种“异常”形势的紧追不舍。美国国际商用机器公司开发了一个名为BluePALMS(预测分析领先建模软件,Predictive Analytics Lead Modeling Software)的程序,允许警方输入未侦破的犯罪细节,并“在一分钟内获得一份列有20名嫌疑人的名单”。“这不是科幻小说”,迈阿密警探阿诺德·帕尔默在IBM的一段宣传这项技术的视频中如此夸耀道。25
这一切令人有点毛骨悚然,从雷神公司的视频中可以明显看出,数据收集及聚合是如何对员工尼克进行轨迹追踪的。宣传片的结尾是:“我们希望预测未来他可能会在……如果你想找到尼克,或者找到他的笔记本电脑,或许你应该周一早上6点去一下健身房。”26
想象一下你自己就是尼克。很快你就是了。
数据库的人力成本
需要明确的是,这些新技术前途光明。销售“当心”产品的Intrado公司的一名员工讲述了一个案例:一个男人劫持了一个女人和她的女儿作为人质。警方想进行谈判,但打电话到该女子家中无人接听。通过使用“当心”,他们找到了她的手机号,通过这一手机号与对方联系上,进行了对话,缓和了局面。27
但“老大哥”的天堂乐园也有烦恼。
由于流入政府手中的信息浩如烟海,且最终进入数据库和观察名单的标准太低,以致错误频出,造成了亚伯·马沙尔和肯尼迪参议员所面临的那种后果。由于恐怖主义数据库中的错误信息,每年有数万名旅客被拦停。28
县市政府也存在类似的问题,“帮派”信息档案激增所引发的不愉快说明了这一点。3个十几岁的越南姑娘因为穿着“胯裆裤和紧身衬衫”在加利福尼亚州奥兰治县的一个购物中心被拦停。其中一个女孩曾经被拦停过;这一次——因为她在数据库里——一个警察非法检查了她的钱包和电话簿,并对她说,“如果你对此有意见,那就不要来我的城市。”圣地亚哥发生枪击案后,一些没有犯罪记录,也没有任何共犯行为的非洲裔年轻男子被判入狱,因为他们被列入了一份机密的执法名单中,上面标明他们是帮派同伙。(在圣地亚哥,和其他地方一样,如果警方认为你穿着与帮派有关的衣服或者认为他们看到你做了一些象征帮派的手势,你的信息会被录入帮派数据库。)29
收集任何被认为是“不正常的”或与身份不匹配信息的这种欲望导致了“融合中心”的探员们频频出错,浪费了宝贵的执法资源。弗吉尼亚州的“融合中心”总结道,黑人大学是“各种类型极端组织矛盾激化的焦点”。它建议对这些学生进行监控。在马里兰州的波托马克河对岸,针对反战人士的一项长达19个月的调查,逮捕了两名天主教修女和一名著名的政治活动家,称他们为“恐怖分子”。在密苏里州,一份专门调查右翼武装组织的刊物指出,第三方总统候选人鲍勃·巴尔和罗恩·保罗的支持者都是危险分子,一时引发媒体风暴。全国范围内,整个地方、州和联邦当局都在关注“黑人的生命很重要”(the Black Lives Matter)——由警察枪击事件引发的抗议活动。30
尽管这些事件凸显了过度收集数据对公民自由的威胁,但对我们大多数人来说,更大的危险来自政府,它已经被海量信息淹没,忽略了关键内容。仅在2007年,恐怖分子筛查中心就建议删除超过2.2万个不符合数据库标准的名字。2009年圣诞节,飞机恐怖爆炸未遂案件后的一项审查显示,数百名禁飞名单上的人获得了签证,美国国务院迅速撤销了签证,理由是这些人“可能会构成直接威胁”。时代广场炸弹袭击者被捕之前——他在恐怖分子名单上——已经登上了飞机,并一直坐到飞机起飞前。另一方面,圣诞节未遂爆炸案的嫌疑人却没有被列入禁飞名单,尽管他的父亲曾警告警方,这名嫌疑人已上报至“恐怖主义身份数据智能环境”(TIDE)。31
负责政府恐怖主义数据库的鲁斯·特拉维斯说:“我最担心的就是如何能够长期保持高质量标准。”32
不受监管的数据库
毫无疑问,如何保持高质量标准是一个值得关注的问题:政府明显缺乏收集、存储、分析和分享我们个人数据的规章制度。“现今的法律体系下,数据挖掘几乎完全不受监管。”一位法律专家说。另外一位专家说:“与其他许多国家的做法相比,美国没有一部综合性的隐私法,这太不寻常了。”即使隐私法已经成文,这些法律也几乎都免除了执法方面的责任。33
2009年“赫林诉美国”(Herring v. United States)一案中,最高法院基本上取消了《第四修正案》对依据数据库执法而受到伤害的人的保护。本尼·赫林因电脑数据库显示有一张对他未执行的逮捕令而被逮捕。随后对他的搜查发现了毒品和枪支。但逮捕令早在几个月前就被撤销了,本应从数据库中删除;而由于警察部门雇员的疏忽,数据库上仍有这张逮捕令。一些法官对这些错误可能造成的损害表示担忧,认为政府应该对此负责。“电子数据库构成了当代刑事司法运作的神经系统,”大法官鲁思·巴德·金斯伯格指出,“数据库错误的风险并不小。”但是大多数人不同意;除非“证明警方在维护逮捕令系统方面是粗心大意的,或者故意伪造记录,为其后的违法逮捕奠定基础”,宪法对此没有太多的规定。34
一方面,你可以看到最高法院对赫林案的多数派裁决源自哪里。试想一下,如果执法部门的数据库错误导致犯罪嫌疑人获得了一张出狱卡,后果会怎样?那很不正常。
另一方面,如果没有法律上的补救措施,政府也没有动力去尽其所能确保数据库的正确。正如金斯伯格法官所指出的,私营企业要为雇员的错误承担责任,正是基于这样一种理论,雇主要确保不会出现这些错误。35
那该怎么办呢?
一些人认为,对数据库唯一恰当的约束是事后审查,以确保没有不当行为。这是斯图尔特·贝克的观点,他是一位倾向保守的杰出律师,在“911”事件前曾担任美国国家安全局总顾问,后来又担任国土安全部的政策主管。他在政府任职后,贝克写了《踩高跷溜冰》(Skating on Stilts),对那些以公民自由的名义反对安全措施的人进行了毫不留情的谴责。他看好数据的前景,并对提出的大多数数据挖掘限制持怀疑态度。
贝克承认,“政府使用数据存在一种令人不安的模式”。政府获取数据总要有一个原因——无论是预防犯罪还是社会保障——然后,“随着时间的推移,将这些数据用于其他不那么紧迫的目的变得越来越有吸引力——比如收集儿童抚养费,或者执行停车罚单”。尽管如此,他说,试图将数据的使用仅限制在收集数据的目的上是在“与技术对抗”。“这就像穿着别人的衣服。随着时间的推移,使用限制在本应宽松的地方变得严格——在本应严格的地方变得宽松。”同样,他觉得,严格遵守传统《第四修正案》的律师,过于关注事实之前的“谓词”,比如政府必须满足“合理理由”,才能允许它进行搜查。36
贝克的工作重点是管理和审查——在这方面,他并不是唯一一个。“如果律师的解决方案是在政府和数据之间设置一个谓词,而官僚们的解决方案是对数据使用进行限制,那么……审查人员的解决方案”只是抓住那些不恰当地使用数据的人。“政府获取个人数据不必受到减速带或防火墙的限制。相反,它可以受到规则的保护,只要这些规则得到执行。”(他所说的“规则”是指谁可以使用数据、将数据用于什么目的的限制,例如出于个人原因使用数据库收集信息。)37
问题在于,这些解决方案是针对数据库出现的问题而设计的,而不是针对数据库正常运行的情况。当然,我们应该惩罚那些不守规矩偷看的政府雇员。我们应该有比现在更好的机制来清除数据库中不正确的信息。38
但事后审查对于应该如何使用数据没有任何帮助。这些数据库保存了我们大量的个人信息,且运行完备,审查无法弥补数据库对自由和安全造成的威胁。
例如,人们迫切需要收集数据,以确定可能存在问题的社区。20世纪40年代,无数的日裔美国人遵从美国人口普查要求,如实提供了他们的原籍信息。一位作者写道:“随着日本和德国之间日益紧密的联盟关系,这些普查不可能让人感到舒服。”但是日裔美国人通力合作,也许他们得到过保证:“根据联邦法律,人口普查数据受到严格的使用限制”,因此个人数据不会被泄露。然而,1942年,国会取消了这些限制,美国陆军部利用这些信息将他们扫地出门,送进集中营。他们在那里苦苦挣扎了好几年,成为政府利用收集到的数据达到一个又一个目的的受害者。在这个例子中,审查并没有提供多少帮助。从那时起这个国家就一直在道歉。39
难道今天不会这样吗?2004年,电子隐私信息中心透露,美国人口普查局向国土安全部提供了一份“邮政编码明细表”,显示阿拉伯裔美国人居住的地方和他们的“原籍国”。当这一消息传出时,国土安全部辩称,这些信息被用于在机场制作阿拉伯语标牌。谁会相信?40
是的,我们确实应该找到解决数据库错误的方法。但首先我们需要思考为什么要创建数据库。像其他执法部门一样,当涉及数据处理时,我们花了太多时间事后进行清理,而不是在着手之前考虑清楚。
既不授权也不透明:融合中心
关于数据库,我们需要回归基本原则:预先民主授权和透明度。通常情况下,当涉及收集数据,规则是现在就行动,以后再考虑隐私和个人安全。这种顺序完全搞反了。民主授权,包括明确的数据使用的限制,重要隐私政策的制定,以及持续的透明化监督机制,应该先于数据库程序的建立。
融合中心令人震惊,充分说明如果没有明确的民主授权,究竟会出现什么问题。国会为融合中心拨款,但它过去没有,现在也不可能授权融合中心的活动。“作为一个州和地方实体组织,”一份国会报告解释道,“每个融合中心的实际任务在很大程度上超出了联邦政府的权限。”不幸的是,大多数州也没有具体解释这些任务。科罗拉多州是为数不多的几个真正定义了融合中心的州之一,但科罗拉多州法律对融合中心应该做些什么几乎没有规定。2013年,布伦南司法中心对融合中心进行了一项研究,发现其是“有组织的混乱”。联邦政府在收集信息的“松散协调系统”上的投入超过10亿美元,“缺少质量控制、缺乏问责、监督不足”。41
因此,多年来官员们交口称赞融合中心是一种至关重要的工具之后,参议院一项两党调查基本上把融合中心称作笑话,也就不足为奇了。当涉及反恐情报收集时,参议院的报告得出的结论是,这些情报实际上一文不值。收集上来的“情报”(报告中讽刺的引用)“质量参差不齐——常常是劣质的,经常无法准时传递”。它常常只是简单地重述那些“往往”与“恐怖主义无关”的旧新闻或公开可得的新闻。一位情报机构负责人表示:“有一堆废话传来”;另一个人表示同意:“你的系统中充斥着大量毫无价值的数据。”报告最后说:“在任何案件中,情报融合中心都没有做出明确而独特的情报贡献,帮助逮捕恐怖分子或挫败其阴谋。”听到了吗?“在任何情况下”,融合中心都不会有帮助。更糟糕的是,报告指出了有三起事件“实际上提高了中心阻碍或偏离联邦所做的反恐努力”。42
另一方面,参议院的报告宣称,融合中心正在“危及公民自由、破坏隐私法的保护”。国土安全部充分意识到,不能“仅仅为了监控受美国宪法保护的活动”而收集或持有信息,然而这种违反规定的行为很常见。一个摩托帮因为一本小册子而被调查,小册子基本上是告诉“成员们要遵守法律”。一份融合中心的情报分析报告是有关一位美国公民对一个穆斯林团体做了一次关于“积极育儿”的励志演讲。国土安全部的一位情报分析员评论说:“这份报告令人恐惧,几乎每个人都可以被写进这种(收集表)。”而至关重要的是,“这次演讲的本质是受宪法保护的活动(公共演讲、集会自由、宗教自由)”。43
如果政府得到允许可以违反经常执法的基本原则时,必须经过明确的、事前的、民主的授权。政府着手一些事情之前,必须走好相关程序——对政府官员和公众都是如此。联邦政府为了一个特定的原因——反恐——向融合中心注入了大量纳税人的钱,但这些中心却决定自己拿走这笔钱,做一些与反恐完全无关的事情。密歇根州的融合中心也不例外,它“改变了自己的使命”,完全放弃了反恐,确定了一个新目标:通过“公私合作”,“促进公共安全”。这种模糊的、广泛的、自作主张的目标恰恰导致了众多的问题。44
同样缺失的还有民主治理的另一个基本要素:透明度。研究过融合中心的政策分析人士说,它们面临着成为“单向镜子”的风险,在这种情况下,公民受到当局的审查越来越多,而当局却越来越不接受公众的审查。或者,正如一家融合中心的官员直言不讳地说:“如果人们知道我们在看什么,他们会大发雷霆。”另一家研究中心的分析师也表达了同样的观点,称之为“蛮荒西部”,政府在“政治因素提上日程、限制其选择之前”尽其所能地进行信息收集。45
宪法保护:DNA检测系统出了什么问题?
当然,预先的民主授权和透明度只是宪法要求的一半;当人民的生命、自由和财产受到威胁时,适用《第四修正案》的保护,也适用《正当程序》和《平等保护条款》的保护。然而,当涉及政府数据库时,对这些宪法保障措施的分析即使没有完全忽略,也往往是极其混乱的。
政府强制的DNA检测恰如其分地说明了这一点。与融合中心相比,国家DNA数据库系统似乎是完美执法的美好图景。人们对DNA分析的精确性赞不绝口,国会和各州的法规同样授权给国家的DNA数据库和相关协议。但DNA检测制度的教训是,即使是经过正当授权的数据库,也必须符合宪法警务所规定的监管标准。我们的DNA收集系统——虽然得到了最高法院的批准——但却没有符合宪法警务所规定的监管标准。原因现在应该已经很熟悉了:未能够区分基于犯罪嫌疑的搜查和无嫌疑的搜查。
DNA检测广告
2009年,一个名叫阿隆佐·金的男子在向一些人挑衅地挥舞散弹枪后,因袭击他人而被捕。他的DNA是根据马里兰州的一项法律采集的,该法律规定从任何因“暴力犯罪”而被捕的人身上采集DNA,并与悬案数据库中的DNA样本进行比较。这一比对结果与6年前一起暴力强奸案的DNA吻合。金最终因强奸罪被判终身监禁,不得假释。46
金辩称,强制执行的DNA测试侵犯了他的《第四修正案》权利。最高法院维持了这一判决,吹嘘“DNA测试‘在为被误判者开脱和认定罪犯有罪方面展现了无与伦比的能力’”。对于一个将阿隆佐·金们终身关在监狱里的体制,似乎很难提出异议。47
最高法院的谎言
虽然DNA技术值得赞美,但法院在“马里兰州诉金”(Maryland v. King)案中的意见却并非如此。法院的裁决是建立在谎言之上的。
金案的问题是,国家是否可以强制收集和测试所有被捕者的DNA。肯尼迪法官在金案5票对4票的多数派的意见中表示,提取金的DNA对于“确认”被捕者是必要的。他用指纹作类比。国家需要知道他们已经拘留了哪些人,为了确定审前释放的条件——他们是否有犯罪前科。
但是,正如斯卡利亚法官在一份异议中所指出的那样,指纹识别已经完成了这项任务,该异议对多数派的不诚实极尽讽刺。此外,在现有的系统下,金从被捕到DNA匹配,马里兰州花了4个月的时间。金的身份鉴定与马里兰州采集并检测金的DNA无关。48
任何人都可以清楚地看到,为了侦破悬案,警方正在检查被捕者的DNA。这不是普通意义上的“身份认同”。确切地说,这正是马里兰州法律所规定的:采集样本是“作为对犯罪的官方调查的一部分”。或者,正如马里兰州州长所说,DNA测试“加强了我们公开调查的能力,并让这些案件得到圆满解决”。49
有什么关系?
你可能在想,那又怎样?谁在乎收集DNA是为了“指认”金还是为了解决他几年前犯下的罪行呢?这对我们有好处:他们抓住了坏人。
但这至关重要,因为利害攸关,需要认真对待。
问题是没有任何“合理理由”——实际上根本没有任何理由——让人相信金犯下了强奸案,从而为收集他的DNA进行调查提供了理由。如果没有“合理理由”,那么搜查就是无效的。正如我们在第七章中看到的,没有理由的搜查是不允许的,除非搜查所有人。如果政府可以随意挑选搜索对象,没有“合理理由”,那么我们都是不堪一击的。
我们稍后会更详细地研究缺少“合理理由”以及如何解决它这一点,但首先让我们了解一下DNA数据库的使用如何延伸到像金之类的坏人之外的。想想伊丽莎白·哈斯克尔吧,她在加州的一次和平示威活动中被捕。她从未被指控任何罪名,但警察拒绝释放她,直到她提交了DNA样本。一旦进入加州的数据库,要想把信息撤销掉就异常困难和昂贵。所以伊丽莎白·哈斯克尔的DNA一直被存在数据库中。50
伊丽莎白·哈斯克尔并非孤军奋战:在没有任何授权的情况下,政府背着我们正在建立一个庞大的DNA数据库。军队士兵统一提取DNA,在需要的时候用于严肃地确认遗体的身份。虽然离开了军队,但他们的DNA被保留了下来。警方要求志愿者提交他们的DNA,以破解一些骇人听闻的未侦破案件。但这些志愿者的DNA最终会被存入数据库,而且往往没有追索权。曾经有人同意提交DNA以帮助侦破一桩谋杀案;但是却花了6年时间,还打了一场官司才把自己的DNA从数据库中删除。警方从烟头和呼气酒精检测仪吹嘴中提取DNA;法院表示这样做完全没有问题。成千上万的新生儿血液样本掌握在政府手中,人们担心这些样本也会被添加进DNA数据库。51
如果你想知道谁会在乎自己的DNA被存储于数据库中,答案——很显然——大多数人都关心。
许多受人尊敬的人士在为是否需要建立一个通用数据库而争论,从前面的描述中可以清楚地看出政府想要建立一个。法学教授阿基尔·阿马尔曾在第三章出现的一位作者,认为宪法不需要授权,在《纽约时报》的评论页上写道,通用DNA数据库将代表“刑事司法系统真正的发展”,因为它将“增加发现违法犯罪行为的可能性,释放无辜者,维护受害者的权益”。因此,他总结道:“把所有公民信息都纳入数据库是有意义的。”甚至DNA测试的创始人亚历克·杰弗里斯自己也说:“如果我们都在数据库中,我们就都在同一条船上——歧视的问题就消失了。”52
但是短期内我们不会建设通用数据库,因为人民不喜欢。政府收集和储存所有人的DNA还远没有得到大众的支持。也许这是有原因的。
据说DNA测试包括被称作“垃圾DNA”的分析。所谓的“垃圾”指的是,DNA链的其他部分可以高度揭示一个人的信息,而用于测试久未侦破的悬案的信息除了匹配事实外,几乎不能揭示什么。科学家们已经发现了如何从DNA链上的13个位点,即基因位点,收集信息,从而创建一个图谱——与其他图谱进行比较时——这个图谱在确保匹配方面非常准确,而对被采集人的其他信息却一无所知。53
“垃圾”DNA理论的第一个问题是,即使是垃圾DNA也揭示了我们的个人特征。它既可以揭示I型糖尿病,也可以揭示种族。事实上,在某些地方,DNA档案被存储在带有种族编码的数据库中。杰弗里斯认为:“科学家将会揭示DNA指纹与疾病之间的进一步令人不安的联系。”54
但更糟糕的是,如果政府把你的“档案”建立在所谓的“垃圾”之上,很有可能它也有建立档案的样本——这个样本包含了整个基因组,意味着构成基因的一切。样本在被用于构建DNA图谱后不会被销毁:它们被储存起来,通常是永久保存。各州的法律各不相同,许多州对将持续多久的问题保持沉默。55
我们得到保证不会使用原始样本——那为什么还要保留它们呢——但这也是一个明显的谎言。我们之所以知道这一点,是因为储存的样本已经被用于“家族”DNA测试的某些方面。家族性测试的工作原理是这样的:政府将被捕者的档案与悬案的档案进行比对,得出与几年前发生的一起谋杀案部分匹配的结果。被捕的人不是凶手,凶手是他家族的某个人。知道了这个事实,政府可以尝试通过进一步的调查找到凶手。为了便于家族匹配,加州允许调查人员返回原始的DNA样本进行新的测试,用于确认男性家族关系。虽然家族测试的成功案例极其罕见,但政府已经使用了这种家族匹配的方法来抓住一些重案的坏人,如臭名昭著的BTK(“bind torture kill” 捆绑酷刑杀害)杀人犯。但这种使用储存的DNA样本的做法并没有得到任何民主授权。后果是,无辜的人不断被执法人员约见,并被要求绘制他们的家庭信息图;一段时间内,许多无辜者被笼罩在令人疲惫不堪的“疑云”之下。56
如果政府可以出于法律未授权的目的重启样本,而且在取样时也没有任何授权,那么他们也可以出于其他原因再次启用样本。比如一些科学家发现了一种方法,可以检测DNA是否有犯罪倾向。这并不像听起来那么牵强,考虑到——正如隐私学者杰弗里·罗森所说——“基因研究……揭示了基因与暴力倾向和其他反社会行为之间日益增长的联系”。
欢迎收看《少数派报告》。57
据了解,政府对那些本应不受侵犯的DNA样本漠不关心。当冰岛将其公民的基因数据出售给解码遗传公司时,该公司创始人卡里·斯蒂芬森表示:“我们从未声称隐私保护是不可破坏的。这里的基本要素是信任。”这对冰岛人来说是行不通的;现在DNA有了更严格的控制,对身份的解码将面临监禁的惩罚。从历史上看,政府在保护数据方面存有不良记录。“或许构建一个存储基因的圆形监狱是明智的,”斯卡利亚大法官在金案中表示异议,“但我怀疑那些撰写了自由宪章的骄傲的人们是否会急切地张开他们的嘴巴接受皇家视察。” 58
制宪造假的代价
这让我们重历宪法保障的彻底失败。没有人质疑这样一个事实,即DNA测试符合《第四修正案》的为某目的而进行的“搜查”。事实上,至少进行了两种搜查:一是用棉签从被捕者的脸颊内提取DNA,另一种是针对疑难悬案对档案进行比对。
在这些案件中,没有任何理由——怀疑——合理的或不合理的,来证明这些搜查是正当的。这就是为什么肯尼迪大法官不得不表现得如此虚伪,以达到他想要的结果。他需要一个目的来证明他的搜查是正当的,而“身份证明”正是他设法捏造出来的。
本书第七章和第八章已提到,政府可以在没有理由的情况下进行搜查,但要这样做,它必须满足两个条件之一。要么它必须搜查所有人,手持明确授权搜查的法令。要么它必须根据统计数据来搜查某一群体,而不是其他人。
这两种情况在DNA测试中都不存在。
可以为DNA数据库的某些部分建立一个符合宪法要求的统计依据。对于那些被定罪(不是被逮捕,而是被定罪)的人,可能有证据表明他们的再次犯罪率很高。人们可以根据统计依据坚持,一旦这些罪犯被释放,收集他们的DNA将有助于阻止将来的犯罪行为,因为他们知道可以利用DNA的发现对其实施逮捕。但这并不能作为收集所有罪犯信息的依据,因为其中一些罪犯,如非暴力毒品案犯,累犯率相对较低。1998年7月17日,在公共广播公司新闻时段节目中,波士顿公设辩护律师本杰明·基恩提出:“如果我们从囚犯身上提取DNA,因为他们有可能(在未来犯罪),我们为什么不能从青少年、无家可归者、天主教神父、任何社会群体成员身上提取DNA,如果有人能够做出一个风险统计参数?”对被捕者进行DNA检测并没有任何统计学上的根据,这些人——就像伊丽莎白·哈斯克尔一样——完全是无辜的,和街上的行人没有什么不同。59
同样,并不是每个人都在DNA数据库中。很明显,政府中一些人希望建立一个通用数据库,但选民不可能支持这样的数据库。因此,政府继续不遗余力:通过颁布法令挑选容易收集的目标,如被捕者,一旦掌握了他们的DNA,就把他们困在数据库中。但这完全是违宪的。
通常,当政府违反宪法,它的行为同样无效。继续在所谓的罪犯数据库中填满名字,其中许多根本就不是罪犯,这样做有意义吗?以加州为例,备受尊敬的非营利性研究机构兰德公司总结道,如果目标是解决未侦破的案件,“将加州的资源用于分析犯罪现场的证据似乎是一种更明智的做法。”也就是说,DNA数据在解决悬案方面更有优势。但这是昂贵的、耗时和严格的。从那些没有做过任何事的人脸颊上提取样本是很容易的。因此,政府做的是廉价而简单的事情,而不是明智的事情,我们的隐私就这样毫无保护地存在于一个包含了越来越多的人的遗传密码的数据库中。60
使用数据库的正当程序
还有一部分宪法未经过认真讨论:正当程序条款。它基本上保证了我们宪法权利的透明度。正当程序条款规定,“未经正当法律程序,任何人不得被剥夺生命、自由或财产”。这意味着,如果政府对你做了坏事,它必须解释原因,并给你机会对证据做出回应。从法律角度来说,政府必须给你“通知”和“表达意见的机会”。
在数据库方面,政府很少遵循正当程序,法院也很少对此采取任何行动。到目前为止,这是人权中相当大的一个漏洞。
在数据库世界里,算法是王道。算法是告诉计算机在搜索数据库时要查找什么内容的公式。人们需要一种方法来对所有这些数据进行排序,而算法提供了这种方法。无论是预测谁会犯罪,决定要审计谁的税,发放福利,还是监控美国人的通信,这些算法一直在做决定。
问题是,尽管政府现在正利用这些算法,根据所掌握的大量信息来决定人们的命运,但它喜欢对算法保密。我们不知道政府在寻找什么,我们当然也不知道使用任何特定算法是否有意义。数据库的保密使我们束手无策,尤其当这些数据分析对我们不利时。
这种保密是完全站不住脚的,因为用于分析数据库中数据的协议容易出错。即使涉及DNA测试和从中得出的结论,也有错误。2015年夏天,得克萨斯州法医科学委员会得出结论,州犯罪实验室错误地陈述了DNA证据与特定犯罪者匹配的可能性,而新方案要求实验室不要说DNA识别错误的人的可能性为百万分之一,更像是三十分之一或者四十分之一。这就完全不同了。也有记录在案的人根据DNA证据被错误定罪,比如约西亚·萨顿,根据DNA被判强奸罪,尽管他比受害者声称的要矮得多,体重也轻得多。61
我们再次回到亚伯·马沙尔和禁飞名单。亚伯的案子终于上了法庭,经过多年的斗争,他现在又可以飞了。这是因为一位联邦法官把整件事都说成是公然侵犯了马沙尔最基本的宪法权利。坏消息是,它花了5年时间和大量的时间、金钱完成宪法上显而易见的目标。62
在禁飞名单上的无数人没有得到的正是正当程序应该给予他们的东西:通知和发表意见的机会。政府不会说你是否在名单上,更不用说为什么了。你可以提交一份“补偿表”,但你没有被告知你在反驳什么。这种卡夫卡式的噩梦应该会吓到我们所有人,从头到脚。63
《第四修正案》和《正当程序条款》加在一起,可以保护我们在数据库和算法方面做很多工作,远远超过法院所承认的。政府使用数据的每一步,从收集到保存,到传播,再到分析,都可能是一次搜查。如果不解释数据库的使用方法而使用这些数据对我们不利,很可能会侵犯我们的正当程序权利。不过,目前,法院几乎只审查数据的收集,而忽略了随后的所有其他步骤。他们根据《第四修正案》禁止不合理的搜查和扣押,并且在数据收集、传播和分析方面几乎完全忽视了正当程序条款。这需要改变。
遵守这两项宪法条款是否会给政府带来麻烦?当然。我们的自由和财产身处危地。常识也是如此。政府不停地为信息保密而斗争,结果却发现它的数据程序毫无意义,算法也不起作用,错误率惊人。这并不能让我们更安全。通常,这是在白痴的差事上浪费大量的金钱。“阳光,”布兰代斯法官在另一个语境中说,“是最好的消毒剂。”64
当家庭悲剧发生在亚伯·马沙尔身上时,他以自己的信仰寻求帮助。当政府把他困在网里时,他放弃了这种信仰。他的美国公民自由联盟的律师告诉他做他想做的事;政府不应该允许粉碎他的宗教信仰。“这是真的,”马沙尔辞职说,“但你也必须生活和学习。”问题是,这是否是我们所有人都应该从亚伯·马沙尔的案件中学到的教训。政府可以在没有足够的保护的情况下把我们扔进数据库,如果我们的生活因此而受到破坏,那我们就来吧。或者我们是否应该明智地管理数据库。65
我们即将到达终点。但不完全是。我们还没有讨论反恐怖主义,以及政府迄今为止最大的数据采集是什么?这是一个引起全国关注的问题:将大量数据收集用于国家安全目的。这个问题,也是我们的最后一个问题,应该有一章进行讨论。