机器写作的现实意义
1.引入机器写作的行业必然性
纵观传媒业的发展进程,技术一直是驱动其变革的重要力量。每一次重要技术的引进,都在某种程度上引发了新闻生产和传播流程的改变。2014年,美联社商业新闻主管Lou Ferrara表示,采用基于算法的机器新闻写作后,在无须增加新的人手的情况下,美联社的商业新闻中关于企业季度经营状况的报道量,将增加10多倍,即从原先每季度300篇上升到4400篇,而与此同时将能把之前用于此类报道的记者“解放”出来,让其可以从事更具有创造性和挑战性的新闻策划和新闻源拓展工作。[58]
机器写作对提升新闻生产的速度和总量、新闻报道的范围以及稿件的质量上的优势不言而喻。这也是我们讨论机器新闻写作的一大前提——承认其未来必然是新闻行业发展的必然趋势。其一是移动互联网的发展大大突破了时空限制,全球进入共时空同步传播的生态格局。基于这一背景,传媒行业对于时效性的需要成了内容生产和传播的一大标配。从发现新闻热点,到抢写新闻稿,再到抢发新闻稿,一家媒体想先于其他媒体发布消息,越来越需要投入大量人力物力财力。随着媒体之间竞争的加剧,智能写作程序的引入能够极大地提高新闻生产和传播效率以及媒体的综合竞争力。
其二是大数据分析技术在传媒行业重要性的日益凸显。使用大数据分析技术,能够对海量数据进行增值管理,从中提炼出报道中所需要的关键性信息。财经类新闻和体育类新闻需要大量的数据作支撑,而数据处理正是机器新闻写作的强项。除了这些对数据分析有硬性要求的新闻类型外,其他一些类型的报道中也会引入数据分析技术,形成更为直观可视化的报道。在观点甚嚣尘上之时,数据管理增值将会凸显其独有价值。从某种角度来看,数据管理增值既为数字时代如何用事实说话提供了一个思路,也架构了一个与用户深度连接的渠道。除机器人进行的信息聚合增值外,基于人工的信息聚合也在推进中。Facebook、Snapchat等社交媒体在2015年下半年陆续推出了类似新闻增值服务。在这一信息聚合增值的大趋势下,可以预见机器人记者编辑及自动化新闻的发展空间将会越来越大。
总的来说,自动化新闻的传播优势很明显,它对新闻生产的速度和总量、新闻报道的范围以及稿件的质量都有很大提升,同时在个性化信息产品生产和推送方面也远优于传统方式。但作为一种新兴技术,它不可避免地存在一些弊端:机器报道范围受限,主要集中于财经和体育报道,新闻产品限于消息和快讯等标准化程度较高的新闻体裁。同新闻记者采写的报道相比,自动化新闻可读性较差。自动化新闻对数据库要求较高,同时在报道视角、创造力和思辨性等方面也存在短板。
2.机器新闻写作的建设性意义
从积极的一面看,机器人挖掘的数据体量大、效率高,数据类型多样化,除了文字数据,还有视频、图片、音频乃至地理位置等,自动化新闻扩张了整体新闻的覆盖面、形态和时效,弥补了人类的局限之处。同时将人类新闻工作者从烦琐的新闻工作中解放出来,让他们拥有更多的时间去开展能够深入反映社会现实的调查性报道,更加专注于新闻阐释,语境发掘以及意义的建构。同时自动化新闻的发展,对职业记者的语言能力、分析能力和叙事能力的提升和突破也是一个巨大的机遇和挑战。
3.实时高效、全天候高产,在突发事件的报道中具有天然优势
能够进行精准化的数据抓取与处理,在搜寻新闻线索阶段能够快速而精确地抓取到符合新闻主题需要的数据。在数据分析阶段,相比于人类记者,机器可以准确全面地计算搜集到的所有复杂而庞大的数据,并且能够根据数据特点较为精确地推算出事情的发展规律和未来发展趋势。在此基础之上,机器可以根据其内置早已设定好的模板进行精确写作,提升了新闻生产的速度以及质量。
美联社曾安排真人记者与机器写作进行比试,Wordsmith两分钟完成的稿件,记者要花七分钟。机器新闻写作的内容创作依赖于人工智能程序来进行,可24小时全天候免费运作,节省了大量的劳动力成本。在2016年里约热内卢奥运会中,腾讯的机器新闻写作程序Dreamwriter撰写了超过3000篇的赛事新闻,今日头条的自动写作程序Xiaomingbot则每天生产30—40篇赛事稿件。2019年12月英国大选期间,英国广播公司使用自动化新闻报道技术,在选举之夜的几个小时内发表了689篇半自动化的本地报道[59],《卫报》则在2019年首次发表了关于澳大利亚选举资金的自动化报道。
4.提升报道的准确度,在一些数据型和模式化的报道中具有更强的可信度
机器新闻写作能够在更大程度上保障报道的准确度和真实性,尤其是在一些数据型和模式化的报道中。它长于处理在人类看来琐碎、庞杂的数据信息,可以保证生成文本在新闻要素、新闻事实、引用数据等方面的完整和准确。除非程序设置出现偏差或者存在人为刻意的干预,否则这种数据信息的文本化呈现,在精准度上要远高于人类新闻记者。借助大数据平台,机器新闻写作能对同一新闻事件的数据来源、内容细节进行多角度的反复对比,从而实现新闻信息的去伪存真。
美国彭博社发布的新闻内容中约有三分之一是使用一款名为Cyborg的AI写作机器人完成的,该机器人能够协助记者每季度完成数千篇公司财务报告相关文章。该程序可以在财报出现的那一刻对其进行剖析,并提供包含最相关事实和数据的实时新闻报道。彭博社主编John Micklethwait表示,AI写作机器人应用于金融领域相对更成熟。[60]
大多数读者无法分辨自动写作软件和记者撰写的某些报道,换句话说,即使记者撰写的文章质量略高于人工智能,读者因为无法区分,记者的部分价值也就不会显现,这就会变相地削弱其作用。有软件公司负责人预测,将来90%新闻稿由机器人撰写,这对新闻工作者甚至是普通的撰稿人来说无疑是不利的。[61]国内也有相关研究表明,机器读者认为机器新闻写作比人类新闻写作的可信性更高,即读者更信赖机器人记者。[62]
不过,机器人新闻生产同样渗入了人的主观意志和偏见,机器人新闻的数据搜集、过滤、分析程序,套用的新闻价值判断模板、新闻报道模板都是由人事先设计、编制的,新闻机器人执行的是设计人的设想和设计,体现的是设计人的意志,甚至不可避免地带有设计者的偏见。美国哥伦比亚大学Tow数字新闻中心曾发布《算法新闻责任报告》,提出新闻机构要“告知公众机器人在实际运行中带有的偏见、所犯的错误”。《纽约时报》也设立专门网页,对其机器人新闻的算法原理进行了通俗易懂的详细解释,并“对该机器人算法存在的偏见直言不讳”。[63]
5.在个性化信息产品生产和推送方面也远优于传统方式
机器新闻写作拥有大量的内容创作模板,可根据不同的新闻主题要求或者不同用户的需求生产不同类型的稿件,已经具备了私人定制的功能。其个性化可以通过两个层面来实现。
其一是可以针对特定用户提供有针对性的新闻服务,实现新闻服务的“个性化”。如美国的叙述科学公司能依据用户群体特征选择报道角度和内容,比如针对某球队的支持者进行赛事报道时,尽量避开使用负面消息和用词。2016年5月《纽约时报》发布了一个名为“全美最宜居和最不宜居的城镇”的新闻专题,该专题的内容是由机器新闻写作程序为不同地区、不同群体的用户个性化定制内容,[64]并不会出现过去那种所有用户接收到的是同一篇新闻稿件的现象,而是机器新闻写作程序在推送时根据用户的IP地址和搜索偏好推送给用户关系最近的相关城镇的新闻内容。2017年,三语(芬兰语、瑞典语、英语)机器人Valtteri被首次应用在芬兰市政选举的新闻报道中,该机器人提供个性化新闻,读者可以用它来搜索和查找有关地理区域、政党和候选人的新闻。[65]
其二是模仿特定媒体或人物的写作风格,实现报道的“风格化”。新闻机器人通过学习,可以模仿一些媒体的报道风格,比如新闻机器人Wordsmith能模仿美联社的“平实”新闻风格,经过调整后也可以模仿NPR的“华丽的”或“更人性化的”新闻风格。
6.机器新闻写作的局限
机器新闻写作在传媒行业内容生产环节中带来的一系列积极影响固然不容忽视,但是因为技术天然和发展不成熟的各种缺陷,使得其在实际应用过程之中可能出现的一些问题也需要注意。
技术天然缺陷和发展的不成熟使得报道范围受限,在报道视角、创造力和思辨性等方面也存在短板,报道可读性有待提升。
与人类相比,智能化程序在数据分析处理和信息生成上的优势不言而喻,但与此同时,人类的情感表达、思辨和创造能力也是智能化机器天然缺失的。这样就不难理解机器新闻写作在应用领域主要集中于体育赛事、财经报道、突发事件等高数据密度、高信息透明度、低语境的新闻报道中。因为这类报道虽然对数据的要求比较高,但是新闻素材往往比较固定,写作模式也较为单一,属于新闻生产中标准化程度比较高的产品。而对于调查报道,新闻评论等一类需要突破表面信息,深入事实内部,充分调用人类思想情感和思辨能力以克服各种现实阻碍的报道任务,或者说对于那些需要在错综复杂的社会关系中做出价值判断的作品,目前是无法通过机器新闻来实现的。
从报道内容看,机器新闻写作注重事实而轻视观点,所呈现出的内容往往是简单信息的排列组合,还不具备价值解析和舆论引导的能力,缺乏深度思考和人文关怀,又因为在报道形式上是对固有模板的套用(虽然目前在技术上能够实现模板风格的多元化)但是总体而言,这种多元化的风格局限于一定的题材范围内,当报道的主题超出模板所能覆盖的范围时,机器新闻写作模式化的短板将暴露无遗,可读性也会大打折扣。
2015年NPR驻白宫前任商业记者Scott Horsley和自动机器写作软件Wordsmith根据Denny's餐饮公司公布的财报数据在同一时间进行写作。[66]最后对比结果发现,机器人写作的新闻稿件,仅仅是对数据的解读,通过数据对比写出了股价上涨幅度。而职业记者撰写的新闻稿件中,既有对数据的客观分析同时写出了销量上升所代表的意义,并且措辞表达更加贴近生活富有人情味。NPR在Polar上对这两篇报道发起公众投票,结果职业记者Scott Horsley获得9916票,Wordsmith获得912票。由此可见,职业记者撰写的具有人情味的新闻稿件更受读者青睐。
此外,数据收集不规范引发侵权问题,发布作品涉及侵权的责任归属问题。
机器新闻写作基于对海量数据的挖掘,这些数据有的来自门户类网站,有的来自谷歌、百度等搜索引擎,有的来自以UGC为基础的社会化媒体,有的来自移动终端对私人化信息的采集等。理想状态下,机器新闻写作应该在尽可能大的范围内挖掘数据,通过对海量数据的不断学习,不断加深自身的智能化。但在现实中,所有数据的采集、利用都存在边界问题。智能写作一旦涉及对他人数据库与网站数据的获取与使用,应视情况取得第三方的授权,否则很容易引发侵权纠纷。机器新闻写作在法律层面的另一个“盲区”,在于新闻产品著作权的保护。创作主体资格障碍、独创性难以准确判断、权利归属不清等问题使得智能新闻的著作权很难在法律层面获得保护。
在创作主体资格认证上,机器新闻写作所依托的模板,是相关技术开发人员将文字程序语言转化成计算机编码语言写成的,包含着技术开发人员对特定资料的搜集与取舍。这些模板是否构成作品,经由这些模板生成的稿件是否享有版权,如果享有版权,版权的所有者应该怎么算。这些问题背后牵扯的权利主体往往模糊不清。
在独创性方面,人工智能的创作往往基于对前人作品的借鉴学习,那么这个“学习”程度是否可以用具体的数字去量化,从而保障其最后生产出来的作品具有区分其他作品的显著特征,享有一定的独创性这一问题有待厘清。2016年,人工智能AIVA通过模仿莫扎特、巴赫、贝多芬等作曲家编写的音乐作品,构建出自身对音乐作品的理解的数学模型,进行自主的音乐创作。为了对音乐作品的质量进行测试和评价,人工智能AIVA的科研团队邀请了专业的音乐家对其创作的音乐进行了试听,然而听众很难区分这个音乐的作者到底是人工智能还是它所学习借鉴的其他音乐家,这也被大众质疑其创作的作品是否存在抄袭嫌疑。[67]在权利归属问题上,智能新闻是基于人工智能技术生成的,而技术只是手段,必然不能依靠技术为智能新闻的侵权“买单”。那么,发生侵权行为后只能由智能技术生产者或技术使用者负责,而这两者谁该对技术侵权负责,又是一个很难去界定的问题。
这些问题之间的界定关乎机器新闻写作在媒体内容生产领域中的规范化运作,而又由于当前相关法律规范的制定滞后于技术的发展,所以今后人工智能新闻著作权的探索可能需要在具体实践中结合具体案例去进一步完善。当前,英国、新西兰、爱尔兰等国家已将人工智能创作的内容纳入版权法的保护范围,欧盟、日本等国家与地区也开始制定新的规则。[68]
7.新型人机关系的建构
“机器新闻写作”这一概念从出现发展到现在,一直都伴随着业界和学界的热议,其中的一大焦点便是“机器人是否会取代人类记者”这一说法。美国自动写作技术公司“叙述软件”的首席科学家克里斯·哈蒙德曾信心十足地预测,机器人早晚有一天会获得普利策奖,因为它可以挖掘隐藏在数据背后的故事。[69]目前主流观点认为,“新技术固然在某些层面替代了新闻工作者,但这并不意味着技术对人的完全取代,针对技术缺陷的完善和发展依然需要人类记者去把关,因而机器人将取代记者这一命题在短时间内并不成立”[70]。相较于对这个问题作出一个非此即彼的论断,我们更需要拥有这样一个清醒的认知:“机器人新闻”的出现从根本上变革了新闻生产方式,替代了新闻工作者的部分工作,这将促使传统新闻工作者专业技能的升级和职业分工的转型。
(1)机器写作技术解放记者
首先,从目前的机器写作技术发展的整体情况来说,智能机器对人力脑力劳动领域的“入侵”尚处于试验阶段,人类的思维目前为止还无法被机器模仿。“机器新闻”的生产主体在本质上是一套人类设计的计算机程序或算法,它只是根据程序进行机械化操作,并不具备人的灵活性和创造性,显然无法僭越人类获得主体性地位。其次,“机器人新闻”的文章偏向于摘录性的工作类别以及数据繁多的报道领域,在文字语言驾驭、对新闻事件的主观判断和深度分析上和人类记者的水平相距甚远。类似现场报道、深度报道和评论等体裁的稿件,“机器人新闻”生产系统还无法完成。
因此,在未来的新闻生产工作者当中,人类记者的工作重心需要偏向于“机器人新闻”无法完成的新闻报道,发挥创造性、故事性和人文关怀,将更多的精力放在提升新闻产品质量上,推出更多反映民众心声、体现时代要求的深度报道,使原本更具“知识性”特征的新闻变得更为优质。2019年初,《卫报》的官方网站发表了一篇关于澳大利亚政治捐款的文章,作者为ReporterMate——一个实验性自动新闻系统。该系统可以快速分析海量数据流后生成文本内容,将记者从日常的单调工作中解放出来,继而去完成更多创造性的任务。[71]
(2)充当好把关人的角色
“机器”无法像人一样有感情、有思想、有洞察力地从环境的变化中捕捉具有较大新闻价值的新闻事件,更不具备对新闻事件背后的真相和事实进行解释和分析的能力。机器写作依托于大数据技术,源头数据的质量直接影响到新闻内容的真实性,而输出的弱把关会进一步影响到新闻的整体真实。如果没有职业记者审核新闻的事实要素,假新闻将会迭出不穷。在新媒体环境下,自媒体、社交媒体快速发展,新闻通过群体传播、大众传播的速度非常快,假新闻同样能够以异常的速度在短时间内覆盖整个互联网络,对用户、传播生态甚至是整个社会产生不良的影响。
在2016年美国大选期间,Facebook就发生了因为将把关让位于算法导致假新闻疯狂传播的事件。有些人认为Facebook利用人工进行信息筛选,人的主观性可能会使筛选之后的言论具有偏向性。迫于舆论的压力,Facebook不得不改变信息筛选过滤的主体,宣布让机器算法技术代替人工来完成信息内容的筛选和把关工作。但是机器算法并没有真正起到把关人的作用,其工作的基本原理是把收集到的用户所有状态数据,包括用户对新闻的点赞、评论和转发的次数等作为筛选审核新闻的依据。某条新闻被点赞、评论和转发的频率决定着它是否能被Facebook设定为热门新闻推送给所有用户。但机器算法的信息源包括各种类型的网络媒体,其中不乏有一些为了博取网民眼球获取利益专门发布虚假新闻的网站。因此,在机器人写作背景下,职业记者作为“把关人”必须要发挥其把关作用。
(3)人机协同将成为未来传媒生产的主流模式
记者对机器新闻写作给自身职业定位已经带来和未来将会造成的冲击保持时刻的警惕是十分必要的。在业界的持续探索中,未来机器新闻记者所展现出来的优势将不仅仅停留在“写稿”层面。目前业界已经开发出了人工智能在重组文章方面的潜力,假如搜集信息的记者所写的报道内容离散、结构混乱,分不清事件描述和结果分析,这时就可以让人工智能发挥聚合功能。除此之外,通过自动搜索网页了解人们在讨论什么,检查客户端是否及时更新了最新事件信息,这些功能都将在不久的将来得以开发实现。
面对机器的侵入,人需要保持自身在主观观察、观点表达、意义创造、经验与直觉等方面的优势,保持人的内驱性表达动力及共情性交流能力。未来理想的人机协作模式是计算机程序或算法主要负责采集和分析数据,找寻具有“新闻性”或有趣的新闻题材,简单撰写出新闻初稿。而记者则负责后期的补充和完善,在智能化新闻生产流程中扮演新的角色。美国西北大学传播学院副教授尼古拉斯·季亚科普洛斯(Nicholas Diakopoulos)在其《新闻自动化:算法如何改写媒体》一书中表示:新闻自动化的未来在于对新闻业基本原则的解构。这意味着,将新闻工作过程分解为实际的信息产品和微型的过程,从而能够分析什么可以被自动化,哪一些本质上是人工任务。通过仔细地解构任务,包含自动化和人工努力的混合系统可以更好地提升效率,降低成本,从而保证新闻质量、抵制商品化。[72]