专题01 人工智能在新闻传媒实践中的应用

专题01 人工智能在新闻传媒实践中的应用

“人工智能”(Artifi CIA Intelligence)是指“用计算机来探索和模拟人类的某些智力活动,使计算机具有听、看、说和部分‘思维’的功能。因此人工智能有时也被称为智能模拟”[1]。据考证,“人工智能”的研究始于1956年的达特茅斯会议,该词由约翰·麦卡锡提出,根据当初的设想人工智能的研究旨在通过“建造一台机器”并“尝试着发现如何使机器使用语言,形成抽象概念,求解多种现在注定由人来解决的问题,进而改进机器”[2]。

1.人工智能的产生背景与动因:(1)学术基础:人工智能涉及控制论、计算科学、统计学、仿生学、生理学、心理学等多种科学。(2)数据累积:从信息和数据的发展来看,人类历史经过口语时代、印刷时代、电子时代及数字时代的发展已经累积了大量的数据资源并以此进入大数据时代。(3)技术条件:计算机技术可以胜任对大规模数据的自动化采集、结构化处理和自动化运算,并能够按照人们设定的指令完成复杂的程序化任务。(4)人力成本:人口老龄化及人口红利优势不再的背景下,劳动密集领域中的人工成本不断提高,人工智能的性价比优势逐渐显现;新闻传媒尽管属于智力密集型产业,但也存在一些劳动密集型的分工领域,尤其是一些程序化、模板式的新闻报道。

2.学术研究动向与代表观点:从目前学术界最新研究成果来看,新闻传媒领域的研究旨趣和代表性观点主要有:(1)对机器人与职业记者关系的探讨:目前学界普遍赞同职业媒体人和机器人之间是基于分工差异的共生协作关系,这种观点强调了两者在能与不能层面的差异性,并建议将程序化、机械式的新闻生产交给机器人,进而将职业记者从枯燥和程序化的新闻生产中解放出来,以从事更具创造性的工作。(2)对新闻生产机器人的价值负载问题的探讨:目前为学术界普遍认同的是技术工具论或技术中性主义,即技术本身并不承载价值,其效应取决于使用该技术的人。这一观点将雅斯贝尔斯“技术仅是一种手段,它为什么目的而服务于人,人将其置于什么条件之下”的观点奉为圭臬,将技术仅仅视为一种工具、一种实现目的的手段,为此,需要比任何时刻都要重视机器人在新闻生产过程中的标准及价值取向问题。(3)对机器人新闻业务进行的一般介绍:如其应用场景、操作规范、适应困境、发展趋向等。目前学术界的共识是,机器人新闻在一些诸如灾难新闻、体育新闻、气象新闻、财经新闻等领域有着成熟且广泛的应用空间,而其在叙事的故事性、人情味、价值观建构等层面有极大的局限性。同时,机器人新闻的生产流程在学界也达成共识,即一个经由结构化的数据处理、新闻性的测量、报道角度的选择及排序、报道角度与数据点的匹配及文本报道的生产过程。

3.新闻机器人与记者的比较:(1)作品的创意性:新闻机器人所生产的新闻,一般是事件描述性、事实陈述性的新闻,在表达人类思想、灵魂、观念等层面难以介入;相较而言,职业媒体人所从事的工作是带有深入分析性的内容生产。(2)对素材的挖掘:新闻机器人依托传感器设备采集的结构化数据或既有的结构化生产资料进行新闻作品的生产,因而其作品总体上是量化的、依赖数据和历史文献的;而职业媒体人在处理大规模数据上有欠缺,但可以通过调查、访谈等方式来获取非结构化的数据。(3)价值取向:职业媒体人所秉持的价值取向是对新闻专业主义(西方语境)或马克思主义新闻观(中国语境)的坚守,而新闻机器人依据已经设定好的程序和模板来加工新闻。从表面上看,机器人新闻具有很强的客观性,但依然离不开机器人背后的人的价值判断、立场倾向对程序和模板设定的影响。(4)双方关系:新闻机器人会局部取代职业媒体人的工作,并最终在机器和人充分合作的基础上实现一种共生和协作关系,但新闻机器人的出现和广泛应用也将会对职业媒体人带来压力和挑战,迫使其从事更高层次的内容生产和更深层次的意义挖掘。

4.自动化新闻生产的流程步骤:(1)程序设计与开发:通过典型的数据类、事实陈述类新闻的若干典型文稿,由具备新闻专业知识和信息与计算科学知识的复合型团队共同完成适应不同语境的新闻报道模板并调优。(2)数据挖掘与收集:通过传感器、计算机抓取或既有文献资料进行数据的结构化整理,完成新闻报道文稿必备要素的提取和优先性的判断。(3)新闻稿自动化撰写:将结构化处理的数据套用到现成的模板中完成稿件的撰写,或由机器完成规律性、趋势性的挖掘、分析和研判,挖掘隐藏在数据中的规律(新闻性)。(4)新闻稿件的把关和发布:除非在机器人写作特别成熟的领域,否则由机器人生成的稿件需要经过人工的审核、修订和完善,最终完成新闻作品的发布。

5.自动化技术在传媒业中的应用:(1)数据采集自动化:利用既有的历史数据或传感器设备根据报道的需求自动化地完成信息的采集,其特点在于有效节省时间的同时挖掘最大规模的数据。(2)稿件生成自动化:将采集的数据进行结构化的处理并根据人工设定好的模板进行自动化的数据填充,形成完整稿件。(3)稿件分发自动化:依据稿件性质和用户需求及兴趣标签对稿件进行自动化、精准化和高效率的分发。上述三种应用分别对应数据采集机器人、稿件写作机器人及内容分发机器人。(4)自动化技术的优势:缩短新闻发生与新闻报道的时间差,提高新闻传播的效率;完成借助人工几乎无法完成的某些领域的报道(比如,基于大规模数据的统计分析);最大限度地增强新闻报道的客观性、准确性及传播的精准度。(5)自动化新闻的局限:新闻机器人所覆盖的领域是财经、气象、体育、自然灾难、犯罪事实等依赖结构化数据或对事实进行描述的报道;新闻机器人仅作为职业媒体人的辅助角色,并未介入新闻采编核心业务;绝大部分稿件依然由媒体人撰写,新闻机器人仍处在试验、探索阶段,尚未实现大规模的商业化;新闻机器人依赖大规模的开放性数据,目前数据公开的数量、质量及匹配政策远未达到机器人新闻发展的需求。

6.新技术应用与新闻的客观性:(1)作为新闻理想的客观性:新闻报道是基于人的价值判断从海量信息中汲取符合某些特定标准的事实素材进行的呈现,尽管新闻业从未停止过对新闻客观性的追求,但真正的客观是人类永远无法实现的目标。(2)客观性的通用准则:以客观世界的本来面貌来报道新闻事实,将事实和观点分开,采用超越特定群体利益的视角来报道新闻事实,给争议的双方以均等的机会表达各自观点,将调查研究等力求客观的方法运用到新闻报道中。(3)改进客观性的做法:调查性报道、公民新闻运动、精确新闻学以及在精确新闻学基础上发展而来的数据新闻等都是从某些角度改进新闻报道客观性的做法,其共同的特点在于拓展新闻报道素材的来源、丰富新闻报道的视角,并试图通过科学的方式来增强新闻报道的说服力。(4)新技术手段的运用:精确新闻及在其基础上发展而来的数据新闻就是将调查研究等科学方法运用到新闻报道中以增强新闻客观性的一种做法,但数据价值、意义的挖掘,新闻选题的标准、倾向,机器人自动化程序的编写等不可避免地受到背后的人及当时的政治、经济、社会、文化等各方面因素的影响。

7.人工智能对传媒业带来的影响:(1)专业生产方式的转变:新闻生产主体由过去的专业生产转向“专业生产 + 社会生产 + 机器人生产”模式;内容生产由传播者中心主义转向基于用户精准需求的受众中心主义。(2)媒体人知识结构的影响:从事简单化、程序化新闻生产的记者将被机器人取代,记者队伍将格外重视跨学科的知识背景和不同学科之间的交叉融合,推动记者向专家型记者、复合型记者转变。(3)职业伦理的重要性凸显:在大数据、人工智能等背景下,自然科学的价值显性化,人文素养、职业伦理、价值审美等的重要性也被空前提升,人文学科在人工智能时代的价值在于为技术的应用制定规范。(4)应对人工智能挑战:侧重创造性、创意性的劳动,将程序化、低端化的工作交给新闻机器人来完成,从这个意义上讲,新闻机器人的大规模应用将会极大地激发职业媒体人的创造性;强化人文理性,培育跨学科思维,将自身打造成全能型、专家型媒体人。

8.人工智能的批判性观点:(1)技术崇拜:对新闻机器人的迷恋将会导致新闻生产中的技术崇拜和数据崇拜。(2)过程黑箱:由机器人生产的文本往往以外在的客观性或数据理性遮蔽了隐藏在背后的权力结构所施加的影响。(3)用户绑架:新闻生产及分发的自动化将会削弱受众的主体性和主动性,从而变成兴趣和偏好的奴隶。(4)信息泛滥:自动化的新闻生产将会带来以伪原创、伪个性化为特征的信息冗余及信息过剩,稀释信息的价值密度。(5)巨头垄断:人工智能作为一种新出现的技术具有很高的门槛,大的互联网机构及媒介集团将进一步加速垄断。(6)内容窄化:将会导致少数人掌握绝大部分的信息生产,不仅会导致信息生产的垄断性,也会削弱信息供给的多样性,导致新闻生产个性化、创意性的缺失。

案例33 内容生产中的深度伪造现象

案例简介:2019年8月底,一款名为“Zao”的具有给视频“换脸”功能的App引发舆论热议。主流媒体及专业人士批评称,软件存在信息不当收集、隐私泄露、非法用途等问题。实际上,用视频技术进行深度伪造,在互联网时代已屡见不鲜,这加大了网络治理难度,也在客观上推动了网络治理手段的升级。

案例分析:(1)存在的问题:版权问题:视频素材来源版权不清晰,有可能侵犯视频版权;隐私问题:用户肖像及身份等隐私信息被平台过度收集;伦理问题:在国外,此类相似软件(deep fakes)已延伸出换脸色情产业链,而在视频效果已经达到以假乱真的情况下,有可能会被滥用;经济安全:在刷脸支付常态化、生活化的背景下,任由此类技术发展极有可能威胁交易安全。(2)相关反思:相比于国外此前同类软件,其技术创新色彩更加明显,这从侧面反映出中国互联网技术的创新能力。软件引发的争议也表明中国网民隐私意识的觉醒。网络传播的便捷性,用户的娱乐、猎奇心理及替代式成名体验是应用迅速传播的主要原因。(3)管理对策:技术的发展需要管理部门更积极地介入,通过立法、监管、行政等手段使互联网创新技术免于滥用,在技术平台严格落实主体责任的同时,公众个体需要增强隐私保护意识。(4)新闻造假:“AI换脸”所带来的是全世界新闻业新的业态风险。谣言与新闻线索的造假成本逐渐降低,对新闻行业的新闻线索识别提出了更高的技术要求,也对新闻工作者的把关能力和受众的识别能力提出了更高的挑战。用新技术深度伪造新闻报道、伪造官方文书、篡改事件视频等都成为新技术滥用背景下的顽疾。(5)技术伦理:媒介技术既非天然的善,也非天然的恶,更非中性的,而是社会环境、商业资本、社会心理等各种因素综合作用的结果。用户权利的让渡和使用权的获得之间的平衡,不能仅靠使用技术的人的自律与自我素养的提升,需要社会整个环境、氛围的营造及合理制度的建构。

9.“媒体大脑”与“AI 合成主播”的产生背景:(1)政策引领:近年来国家层面持续推出的网络强国战略、“互联网+”行动计划,以及在党和国家对新闻舆论宣传工作、媒体融合发展高度重视的基础上推出的传统媒体和新兴媒体融合发展部署等,为媒体的智能化发展提供了政策层面的宏观引领。(2)技术积累:媒体的智能化转型是近年来在人工智能、大数据、物联网、云计算等新技术持续累积基础上进行优势技术资源整合并与传媒实务进行深度融合的结果。(3)行业需求:新的媒介环境下主流媒体所面对的严峻挑战,紧迫要求主流媒体必须以积极的姿态拥抱信息革命的潮流,不断借鉴、汲取、整合、采用全新的技术手段实现对自己的业务流程甚至是产业生态的改造,以适应行业环境的巨变。(4)专业优势:新华社等国家级权威媒体在组织管理、创新机制、数据积累、资源整合等方面有着得天独厚的优势,故而其智能化转型之路是作为专业类媒体的“国家队”所具有的核心资源与互联网机构的创新技术进行优势叠加的结果。(5)资本助推:无论是“媒体大脑”还是“AI合成主播”,都能够适应于若干的应用场景,其大规模商用的可能性和无比广阔的市场前景契合了资本增值的需求,激发了各级各类主体的创造性。

10.“媒体大脑”的功能与应用场景:(1)具体功能:“媒体大脑”具备自动采集生产新闻、新闻智能分发、语音识别转写、版权监测、人脸核查、用户画像、智能会话、语音合成等功能,是对新闻采编中心功能的全方位延伸。(2)应用场景:为记者、编辑提供“智能数据工坊”(自动收集数据并对数据进行格式化处理)、“智能媒资平台”(机器自动生成各种素材并按照标准存储,随时等待调用)、“智能生产引擎”(自动化、流水线般地生产新闻产品)和“智能主题集市”(为用户设置个性化报道主题)。(3)智能编辑部:“媒体大脑”是新闻机构的智能编辑部,是以高速度、流水线、自动化生产为特征的内容智能处理中心,通过媒体人与“机器人”的分工与协作完成线索挖掘、素材收集、素材存储、内容加工、新闻分发、版权监测、用户识别等全过程任务。

11.智能媒体对新闻业务的变革:(1)信息采集的自动化:借助传感器、无人机、摄像头、行车记录仪等智能化数据采集及转化设备,实时、动态洞察新闻线索,挖掘文字、图像、视频等形态的多维数据,并利用精准人脸识别、数据源追溯等精准分析手段,替代记者、编辑进行素材真实性的核查,有效减小新闻造假的可能性。(2)作品生成的自动化:依据海量的格式化数据和新闻报道素材库代替记者、编辑自动完成数据新闻、富媒体新闻等形态的作品生产,目前智能媒体能够生成的作品形态包括文字、图表、语音和视频等若干类型,并且在体育、财经及其他较为依赖数据的新闻报道领域应用较为成熟。(3)内容分发的自动化:智能媒体在对用户人口统计学数据、媒介使用习惯数据、场景位置数据、行为偏好数据等进行分析的基础上对不同用户的媒介使用习惯和信息阅读偏好进行精准研判,实现内容生产定位与内容精准推荐的自动化。(4)新闻呈现方式变革:利用“AI 合成主播”、虚拟现实技术、增强现实技术、智能接收终端等多种形态、方式和终端传输新闻报道,增强了新闻报道的针对性、场景化、时效性和沉浸感,能适应不同场景、不同终端的信息接收。(5)内容接收终端变革:内容接收终端由此前的电视、电脑、手机等屏幕拓展为智能穿戴设备、智能家居设备、车载智能设备等,延伸了新闻内容的传播渠道和接收方式。(6)传受交互的智能化:智能媒体采用智能语音问答、大数据智能学习、图文影音智能转换等新技术手段为用户互动能力赋权,促进了新闻用户与新闻生产中心交互的便捷性,改进了用户体验,也有助于新闻生产主体进行内容生产和传输方式的优化。(7)效果评估与版权维护:通过全网大数据监测系统可以有效实现对已经生产的内容所达到的传播效果、覆盖群体、转载数量等的精准测算,并能够运用算法技术评估是否存在侵权现象,可以有效避免侵权、抄袭、洗稿、篡改等问题。

12.主流媒体智能产品的影响及意义:(1)推动媒体转型升级:人民日报、新华社等主流媒体推出的智能媒体产品以“网络强国战略的价值引领+权威媒体的专业优势+互联网机构的技术创新优势”为核心支撑,以技术创新和内容建设的深度融合创新了主流媒体信息采编及内容生产的方法、流程与机制,推动了传统媒体机构新闻采编业务向智能媒体的转型升级。(2)提升新闻生产效率:有效压缩了新闻生产从收集素材到内容发布的全过程所消耗的时间成本,大大提升了新闻生产、分发与传播的效率,更加契合互联网时代新闻受众对新闻报道时效性的需求,提高了新闻生产效率和媒介机构的行业竞争力。(3)满足用户精准需求:这些智能产品具有精准勾勒用户画像、精准挖掘用户个性化需求的功能,有助于在确保主旋律高扬的背景下最大限度地生产契合网络传播规律,满足不同用户群个性化需求的内容。(4)巩固主流意识形态:这些智能产品,使权威媒介机构以更具核心竞争力的方式壮大了“国家队”的影响力,有助于实现主旋律声音横到边、纵到底、全覆盖,能够有效提升主流意识形态的传播力、影响力、引导力与公信力。(5)强化“国家队”的国际影响力:人民日报、新华社等主流媒体推出的系列智能产品是当前人工智能尖端技术与媒体实务进行深度融合的标志性产品,在国际传媒业务领域具有极强的示范、引领价值,同时也为世界各国媒介机构的转型升级提供了解决方案,是中国智慧在国际传媒领域的重要贡献,有助于强化传媒“国家队”的国际竞争力,壮大中国传媒界的国际话语权。(6)带来强大的示范效应:传统媒体向智能媒体转型需要集合自身优势顺应数字社会的发展潮流,运用人工智能、大数据等前沿科技对新闻生产流程进行改造;媒介机构与人工智能的深度联姻全方位、全过程、全链条地深入传媒领域将会带动新闻业务、媒介生态、产业格局的全方位变革。

13.机器人生产的社会及劳动价值:(1)价值属性:机器人生产是人类的劳动智慧成果,属于人的劳动产品;机器人生产的前提是在人的操作、指挥下进行的,无法完全脱离人;人类特有的活动是劳动,机器人参与劳动过程本身并不创造劳动价值。(2)社会价值:机器人生产最大限度地提升了机器的效率和价值;机器人生产大大解放了原本可以从事更复杂劳动、创造更大劳动价值的人。(3)机器人与人:价值是由劳动创造的,“机器人投入生产是未来社会大生产进步的必然,只有人才能通过劳动创造价值,因此机器人不会取代人”[3]。

14.机器人生产新闻:(1)内容特色:机器人新闻的素材来自大量客观的现实数据,在理性报道的同时还可为受众提供有针对性的参考建议;通过对大数据的筛选、比对最终生成的新闻产品符合大多数受众的信息选择倾向,具有较大的受力面;人工智能、算法等技术使得新闻事件在发生时,新闻机器人就能第一时间做好报道工作,体现新闻的时效性;中小型媒体发挥市场“长尾效应”,“通过写作机器人发掘受众所需的次要新闻,实现个性化新闻推送”。[4](2)存在问题:机器人生产的新闻大部分集中在体育类、财经类等需要较多数据支撑的领域,因此并未能广泛应用;机器人新闻的背后是一整套的程序编码和制式模板,并不能适用于复杂、多变的新闻报道场景,缺乏深度报道能力;是否有稳定可靠的数据来源会影响新闻信息的失真与否;设计机器人的人的价值观、算法逻辑将会影响新闻内容的价值表达与内容中立;算法程序对信息的过度搜集与缺乏保护意识会置新闻当事人于过多暴露在公众面前的境地;“后台不可见的‘黑箱’新闻生产让机器人缺乏必要的公众监督”[5]。(3)伦理审视:大量类似的新闻报道模板,“机器人新闻的同质化生产将冲击传播生态的多样性导致新闻信息表达多样性的弱化”;选择的新闻来源不是第一手客观事实,“无论是数据新闻还是传感器新闻都有人类雕琢的痕迹”;纯粹依靠对数据的分析缺乏人文的感性,“机器人写作的文本是一种大众化的取向”。[6](4)发展路径:记者与机器人“人—机”结合,机器人作为编辑、记者等新闻从业者的辅助工具进行前期素材的收集、整理,中期的辅助挖掘、分析以及后期的校对、成稿等工作;开拓新闻报道领域,可逐渐“延伸至社会新闻、娱乐新闻和时政新闻等,写作方式与主体也越发多元化”[7]。

15.社交机器人:(1)基本概念:社交机器人指的是“社交媒体中,由人类操控者设置的、由自动化算法程序操控的社交媒体中账号集群(swarm)”。它表现在可以最大限度模拟、模仿真实的用户操作进行点击、点赞、转载等简单操作,甚至对话、发表意见等高级交互操作,从而混淆真实用户行为与机器人行为,以达到背后操纵者的一系列目的。(2)典型特征:易被操纵(服务于特定的群体和特定的目的)、强力传播(自动化、高智能、批量化地发表契合场景且具有个性特征的信息)、隐蔽身份(以正常用户的身份存在,难以被普通用户识别)。(3)传播机制:具备“建构网络结构、改变网络结构、驱动网络结构、集群化与智能化、按需高效地改变社交网络的动态结构来控制社会扩散的范围和速率” 五位一体的传播机制。(4)学理研究:传播现状研究“以描述性研究为主,对其在传播中发挥作用的机制原理的解释性研究较为匮乏”;受众效果研究层面,“聚焦其状态和行为传播策略,探究不同传播策略对目标受众的影响效果和效率,但容易引发伦理问题”;技术治理研究层面,“依靠技术手段对其进行治理,以身份识别、捕捉、检测、防控为内容,但纯技术手段不足以应对”。(5)治理路径:技术不分善恶,“制定可衡量的判别标准、原则与尺度是前提”;技术识别为基础,“以彼之道治彼之身”;社交媒体为主战场,针对“五位一体”的传播机制进行综合治理。[8]

16.新闻聊天机器人:(1)基本概念:新闻聊天机器人是通过计算机智能仿真语言编写用来模拟真实对话环境将新闻信息提供给读者的一种交互式阅读体验应用程序。比如:CNN、BBC、Quartz等的新闻聊天机器人。(2)典型特征:新闻游戏化、虚拟人设化、媒介智能化。[9](3)互动传播路径:“对话式的人机互动方式;超文本式的内容互动方式;‘后聊天室’式的人际互动方式。”