二、新闻写作

二、新闻写作

新闻写作是新闻生产的第二环节,也是整个新闻生产流程的核心环节,与新闻产品质量好坏联系最紧密。算法媒体时代,对新闻写作影响最大的就是机器人写作。一方面,机器人写作带来了新闻的自动化生产,提升了新闻写作的效率,新闻写作有了固定的模板。另一方面,算法采集新闻线索与自动化新闻生产密切配合,推动着定制新闻产品的发展。写作机器人,其本质就是一个软件或者说是一种算法程序,通过程序或软件的开发之后,写作机器人还需要计收大量的人工训练,之后才能应用于新闻生产,所以它的出现并不能取代新闻从业者的位置,或者我们可以说,写作机器人的出现解放了部分劳动力,为新的内容和新的新闻产品形态的孕育提供了多样可能。机器人写作目前发展已经初具规模,其写作也有了较为固定的步骤,主要包括了三个环节。

(一)大量结构化的数据的抓取

算法媒体时代,巨量数据信息通过传感器与网络爬虫工具迅速收集汇集,随着大量数据库的建立,这些数据信息被快速结构化,为机器人写作提供了大量的新闻源,抓取结构化数据也是机器人写作的第一步骤。目前结构化数据应用较多的领域为财经及体育,与机器人写作实践最广泛的领域完全吻合。

(二)数据整理与分析,确定报道内容

机器人写作的第二环节,就是将抓取到的数据进行整理分析,以特定的格式将数据输入到写作机器人后,机器人可以按照人为设定的算法程序进行数据分析,从中提取有价值的报道内容。通过数据分析与整理,能够获得一些重要或者“反常”的数据,这些数据会被标记,成为潜在的报道内容,如果这类数据较多,算法还可以对这些数据的重要性进行排序或进行分类,在此基础上来确定报道内容。

(三)导入模板生成稿件

通过对数据的整理与分析,确定了报道内容之后,就可以进入写作的最后一步了。即将确定的新闻内容导入模板,直接生成稿件。需要明确的是,通常新闻生产机构或程序员会事先为写作机器人提供多种报道格式,算法工程师会不断地对写作机器人进行训练,使其能够发现不同的报道角度、组织不同的文章架构,从而设定模板。写作机器人将确定的报道内容套入模板,通过选词造句,与过去的相关报道相结合,即可生成新闻稿件。目前,算法发展更加成熟,写作机器人还能够对稿件进行润色,添加一些带有感情色彩的语气词等。以百度智能生产平台的功能演示为例,对于同一数据源的内容,通过算法设置不同模板,能够生产对同一内容的多种报道形式。如图15-7基于同一数据源与报道内容,不同模板生成的新闻稿件。

图15-7 写作机器人报道天气新闻示例