在大数据和人工智能时代定义隐私
“隐私”一词在美国最常用于个人信息处理的相关法律法规和政策中,其他国家则往往称之为“数据保护”。审视美国的数据隐私保护时,重要之处在于明确这是一个模糊的概念,缺乏统一定义,其含义亦随着时间的推移而逐渐演化[1][2][3]。数十年来,美国在隐私保护方面未出现过重大变革,仅依赖于各部门自身的具体法规。法律学者Daniel Solove创建了最全面、最实用的隐私分类法,包括四大类:信息收集;信息处理;信息传播和侵犯行为。[4]
(1)信息收集包括监控和询问。监控涉及对个人活动的观察或记录,询问则涉及“各种形式的询问或对信息的探查”。[5]
(2)信息处理包括信息聚合、身份识别、突破安全屏障、信息的二次使用和将信息所有者排除在外。信息聚合是将关于个体的各数据源加以组合。身份识别指将信息与特定个体相关联。突破安全屏障的行为令个人信息易于受到不当访问。二次使用是指未经主体同意、将为特定用途收集的数据重新用于其他目的。将信息所有者排除在外则是指个体未被告知有关其数据的管理、对自身数据的访问被拒绝,或被排除在外、无法参与自身数据管理的情况。“这些活动涉及的是数据的维护和使用方式”,而非其收集方式[6]。
(3)信息传播涉及违反保密规定、信息披露、信息曝光、扩大信息获取范围、勒索、盗用或扭曲信息。违反保密规定是指不遵守对数据保密的承诺。信息披露指暴露“有关个人的真实信息从而影响他人对其性格的判断”。信息曝光指的是披露裸露图像、暴露人体私密部位或强烈的情绪状态。扩大信息获取范围指的是个人信息的获取范围被放大。勒索指威胁透露个人信息。盗用涉及“使用数据主体的身份,服务于他人的目标和利益”[7]。扭曲描述的是分享数据主体的虚假信息。
(4)侵犯类别涉及侵入或决策干预。侵入行为指的是侵入并打扰他人的独处。决策干预“涉及政府干涉数据主体对其私人事务的决定”。[8]
随着新技术令个人数据的收集、处理和传播方式不断转变,学者们试图重新定义隐私,包括:
(1)隐私即语境完整性。Nissenbaum发展了隐私即语境完整性的概念,以解决早前隐私概念无法应对新颖信息系统带来的彻底变化的问题。Nissenbaum认为隐私并非保密权或控制权,而是特定社会语境下“个人信息的恰当流动”——或语境的完整性[9]。她的语境完整性框架是一种描述性、启发式的工具,用于理解人们对影响个人信息流动的新颖或不断变化的技术体系的响应。
(2)互联隐私。Danah Boyd的概念中,数据隐私为“互联隐私”:“我们分享的关于自身的内容包含了许多与他人相关的信息”[10]。此种方式定义的隐私将焦点从个体转移,展现了我们自身的隐私和数据与其他人有着密不可分的联系。
(3)大数据隐私。Jens-Eric Mai注意到,大数据分析和机器学习技术的传播使我们有必要扩展隐私的概念,纳入预测性分析的使用和数据使用的社会经济背景[11]。正如Kitchin和Lauriault所言,“一个人的数据影子不仅仅是跟随着他们;更会超前于他们”[12]。个人数据越来越多地用于预测性分析,将个体归类为不同的广告类别或风险类别。概率模型被用于预测人类行为,通常在未征得同意或未被察觉的情况下进行。