新闻写作智能化
当前,人工智能代替人类进行写作已经不再是新鲜事,写作机器人的推广在一定程度上解放了新闻产业劳动力,使得人力可以集中在特稿、专稿这样需要深度思考和情怀诉求的写作上。在2018年全国两会上,新华社的“媒体大脑”在大众面前首次开工亮相,发布了关于两会的全球第一条内容,并整理出了两会期间舆情热词。人工智能可以24小时在线监测全球范围内的新闻事件,并挖掘相关资料数据,根据存储的格式模板生成新闻稿件,极大地提高了生产效率,节省了人力成本和时间成本。在财经、体育类新闻领域中,写作机器人已经大幅度替代新闻从业者,成为稿件生产发布的主体。
我国媒体在机器人写作方面起步虽晚,但发展势头很足。在国内媒体行业中,腾讯财经是最早开始使用智能机器人进行稿件写作的。2015年9月,腾讯财经发布了一篇名为《8月CPI同比上涨2.0%创12月新高》的文章,文末添加的注释“本文来源:Dreamwriter,腾讯财经开发的自动化新闻写作机器人,根据算法在第一时间自动生成稿件,瞬时输出分析和研判,一分钟内将重要资讯和解读送达客户”[6],引起了业内的广泛关注。到了2016年10月,Dreamwriter又与国家统计局共同推出了《9月CPI涨幅回落 货币政策或维持宽松》一文,经过腾讯公司对Dreamwriter技术的升级改造,这次Dreamwriter根据不同群体的受众需求生产了三个版本的不同稿件,分别为精要版、民生版和研判版三种版本。为了迎合用户的个性化需求,这三种版本的文章侧重各不相同,“研判版的内容主要包括‘财政政策与货币政策’与‘实体经济与市场投资’两个部分的内容,该版本的受众对象侧重于关注经济的人群或者投资者;民生版则提供了食品价格、居住价格的变动趋势,受众群体多为广大百姓,因而内容贴近百姓生活;精要版则是用简短明了的文字内容描述9月份的CPI变动情况,内容重点突出简洁”[7]。写稿机器人背后的核心技术,主要涉及智能撰文技术、内容抽取技术、要闻萃取技术。基于此,腾讯内部一款集合了新闻资讯类AI和超级资讯服务秘书类的应用正在研发当中。[8]
传统传媒产业也发生了智能化变革,2015年11月,新华社推出了一款智能写作程序“快笔小新”来编写撰稿,“快笔小新”是一款基于人工智能、机器学习、数据分析等技术于一体的稿件创作程序。根据新华社总编室业务管理中心主任胡金芳介绍,目前“快笔小新”供职于新华社体育部、经济信息部和中国证券报,可以写体育赛事中英文稿件和财经信息稿件。[9]“快笔小新”可根据写作主题内容的不同而匹配不同的文本系统发布稿件。往往一篇稿件的生成要经过数据采集、数据加工、自动写稿、编辑签发四个阶段,在财经类新闻方面,通过建立机器人发稿学习模板,“快笔小新”可以自动进行数据的抓取、计算、数值评估,并完成相对复杂的语句及段落的写作,只要人工输入股票代码,关于它的财报分析就能迅速成文。在推出此项智能程序后,新华社总编室着手制定了机器新闻写作的管理规范,并已申报了《一种面向短新闻的机器写稿方法与装置》和《基于模板自动生成新闻的系统和方法》这两项专利。[10]
另一家财经类老牌媒体第一财经在2016年5月30日举办的“第一财经技术与创新”大会中正式宣布了“DT稿王”的亮相,这是由阿里巴巴和第一财经共同出资建立的媒体实验室所研发的智能财经类写作程序,DT是数据处理技术(Data Technology)的首字母缩写,意味着数据技术时代的来临。用机器代替人完成实时监控信息源,利用文本解析和信息抽取技术实现自动信息抽取,采用机器学习算法并融合第一财经编辑记者团队的经验、智慧,以模板和规则知识库的方式根据实时抽取的信息做出判断,输出相应的模板及规则知识库内容从而产生新闻,以此应对海量、高速、多样的大数据产生的信息,这种具有学习能力的智能系统加上人脑创造力的辅助,使得“DT稿王”成为写稿机器人中的“尖子生”。这一称呼体现在以下几个方面。第一是“快”,“DT稿王”利用多台服务器分布式地对发布的公告进行扫描,可以即时对公告进行分类,筛选出待写新闻稿的公告,并通过后台的信息提取算法提取出该公告的重要信息,机器写稿平均阅读7471字/秒,是普通人阅读速度的50倍。然后,按新闻稿成稿格式重新组织输出,机器写稿为28字/秒,相当于1680字/分钟,是普通人打字的35倍。第二是“多”,“DT稿王”通过海量抓取、海量分析,主要针对上市公司公告、财务报表、官方发布、社交平台、证券行情等信息源,日阅读3000万字,30天可写完一部《四库全书》。第三是“好”,“DT稿王”生成的稿件语句流利通顺,完全符合人类自然语言的语法,而且“DT稿王”在海量的信息中抓住重点信息本身的重点,协助决策的快速实施,以东旭光电科技股份有限公司5月14日所发布的公告为例,全文2274个字,总结成113字的核心内容和23字的标题,同时不是盲目地抓取公告中的大标题。[11]
一直走在技术前端的今日头条,其实验室研发的AI自动化写作程序“Xiaomingbot”在2016年的里约热内卢夏季奥林匹克运动会中表现出色,这是国内第一款用于报道奥运赛事的智能机器写作程序,在奥运会开始后的13天内,它一共撰写了457篇关于羽毛球、乒乓球、网球的消息简讯和赛事报道,每天30篇以上。它的报道不仅囊括了从小组赛到决赛的所有赛事,且其发稿速度之快,几乎与电视直播同时。作为第二代新闻机器人,“Xiaomingbot”不仅可以通过检索图片自己选择图片,还能模仿人类的语气,使用诸如“笑到了最后”“实力不俗”等词语。[12]可以发现,“Xiaomingbot”比起第一代写作机器人有以下特点:一是写稿速度更快,可以2秒内完成稿件并上传至媒体发布;二是拟人化程度更高,可以根据比赛选手的排名、赛前预测与实际赛果的差异、比分悬殊程度,自动调整生成新闻的语气;三是发布稿件类型增加,不仅可以发布赛事消息,还可以生成整个比赛的赛事简报;四是能够图片识别筛选,在文章 中选取插入赛事图片,图文并茂,更加生动形象。
同样,由新华智云自主研发的国内首个媒体人工智能平台MAGIC在2018年6月首次亮相俄罗斯世界杯。据统计,从6月14日俄罗斯世界杯开赛至6月28日11时,通过MAGIC平台生产的世界杯短视频达到28919条,占主要视频网站世界杯中文短视频总产量的69%。其中,最快的一条短视频《进球了!秘鲁VS丹麦》,在丹麦队进球后16秒内,就自动合成并发布在视频网站上。[13]在2017年12月26日,新华社发布了国内首个媒体人工智能平台——“媒体大脑”1.0,由新华社的新华智云自主研发,其功能为提供线索、采集素材、编辑生产、分发传播、反馈监测等,经过改良,于2018年6月13日发布的“MAGIC”则称得上是“媒体大脑”2.0版,MAGIC是MGC(机器生产内容)和AI(人工智能)的结合。据新华智云负责人介绍,AI时代内容生产基础设施将以大数据处理技术、智能算法技术和人机协作技术为核心,包括智能数据工坊、智能媒资平台、智能生产引擎、智能主题集市四大智能系统。[14]在这一过程中,人工参与和观察的角色依然存在,MAGIC的本质是“人的智慧+机器的智能”,这是一种“全量数据+人机协同”的工作模式。现有的智能技术可以进行初步筛选和校对,但最终还是需要人的再校对,相信随着人工智能技术和计算资源量的提高,人工审核的依赖度会逐渐下降。除此之外,在未来计划中,MAGIC还能够帮助内容生产者找到新闻角度。“MAGIC通过机器辅助,海量的历史和实时内容将被精细化地自动拆解,并以颗粒的形式存储在云端,一旦有最新的事件发生,机器会自动调用云端的数据颗粒,实时生成视频新闻,内容经过数据化后,会产生新的内容,这就是MAGIC的魔法。”[15]
智能技术的发展还为新闻生产的形式注入了新的活力。大数据领域学者舍恩伯格在《大数据时代》中提出,大数据技术对人类产生了前所未有的改变,不管是行为方式还是思维方法。这种改变在新闻传播领域更加明显和突出,尤其是数据新闻的出现,其以大数据为基础,突破了传统新闻报道形式,深受新闻学界和业界的青睐,并且未来有可能成为推动新闻发展的最具潜力领域之一。[16]在2019年5月27日第七届中国网络视听大会期间举办的“智媒先锋5G未来”视听新生态发展论坛上,中宣部媒体融合专家组成员、中国人民大学新闻学院教授宋建武在主题演讲中如此形容:“人类将会从过去靠人工采集信息提升到靠机器来采集数据,未来会通过算法处理数据来产生信息。而握住数据产生的关键节点,将会是一个媒体未来生存的关键,数据可视化将成为新闻生产的关键性技术。”[17]当前,传统媒体的信息采集与生产的过程,不足以在信息爆炸的现在辨别和发现真相,而数据的应用则为信息提供了真实可靠度。新闻数据可视化可以体现为文字、图片以及越来越占据位置的视频形式和更多更丰富的形态,比如交互式页面、沉浸式体验等。“在人工智能时代,数据新闻内容生产的新闻价值也是需要在海量数据中寻找具有价值的信息,需要计算机拥有人类大脑一样的洞察力和学习能力,基于这个思想,深度学习技术应运而生。深度学习技术通过构建模仿人脑神经细胞的神经网络模型,借助强大的运算设备,如云计算等,利用互联网海量数据不断地进行训练,从而实现机器的智能化,并完成多种数据的挖掘与分析功能。”[18]
除了可视化工具,近年来新闻制作者还不断地运用创新技术增加新闻内容的“在场”体验感,“过去电视有直播,但是电视的基于平面的,基于二维空间屏幕的直播。一方面只能观看,另一方面观看的角度会受到导播、摄像他们的角度限制。但是我们还是会看到除了导播和摄像的机位之外,那些当事人、参与者的视角可以让我们看到更多幕后的花絮,全方位了解新闻的现场”[19]。而AR/VR技术的辅助将会大大增加观众对现场的感知程度,在一些体育赛事和大型活动中,AR/VR与直播相结合的报道突破以往文图结合的平面感,让激动的球迷在家可以感受到现场的氛围和实时战况。当然,“AR、VR进入新闻领域可能还有很多障碍需要克服,技术的普及,人的生理限制,甚至对新闻伦理提出新的挑战”[20]。