数据的滥用与隐私安全

三、数据的滥用与隐私安全

算法新闻的另一个重要伦理问题就是收集数据时是否侵犯了个人或组织的隐私权。在主要依赖人工选择的媒体分发阶段,数据来源和质量问题属于个人或编辑部责任层面,而现在算法技术的应用使得这一责任转移到了媒体组织或第三方的管理级别,因为是由他们来决定将哪些数据运用于产品的。在这种情况下,数据权力和权利的问题也随之出现,由于算法新闻编程的复杂性,自然语言生成系统经常被外包给诸如Automated Insights或Retresco这样的专业公司。那么我们自然会担心,这些媒体机构和专业机构是否有权处理这些隐私数据并将生成的文本用于商业用途,在这个过程中是否会侵犯我们的隐私数据?

算法使用与管理的背后也有一些最重要和最具影响力的新闻传播平台,在国外的报告中显示几乎所有的人都在使用这些平台。皮尤研究中心(Pew Research Center)的一项研究发现,对61%的千禧一代(出生于1982—2000年的一代)来说,Facebook是有关政府和政治的新闻来源,但大多数公众并不知道Facebook的新闻推送是由算法策划的。[4]当你考虑到Facebook仅仅根据一个人的新闻推送中推送的大量硬新闻就能影响选举的投票率时,这个就变得更加有问题了。如果带有偏见的搜索结果可能会改变未做出决定的选民的投票偏好,那么我们就不禁要思考,像Facebook这样的大公司在多大程度上搜集我们的信息,以及他们是如何运用这些数据的,这些会对我们的生活产生怎么样的影响?

2018年3月的“剑桥分析”事件使Facebook陷入信息泄露的丑闻之中,尽管扎克伯格一再否认这是一起信息泄露事件,但这件事也成为压垮人们信任的“最后一根稻草”,人们更加意识到个人信息的重要性,以及我们的个人信息在多大程度上被人有目的地利用着。在大数据时代,我们的年龄、性别、工作、爱好等信息会以时间为单位被精确记录,我们的隐私信息每时每刻都在被庞大的数据收集库记录,这些被精确记录的数据信息可能就会成为不法之人的目标,我们又该如何确保我们的信息安全?