8.1 人工智能主播的诞生背景与发展历程
以人工智能主播为例,它的出现引起了社会各界的广泛关注,开创了新闻报道的新格局。那么人工智能主播究竟使新闻报道的生产方式发生了怎样的变化?针对AI主播的优势与在新闻业中的具体应用现状展开研究和分析,未来的电视新闻行业在迎来新的考验和挑战的同时,新的发展空间和机遇亦在酝酿之中。
人工智能主播(AI主播)的理念发轫于英国,并在中、韩、日、美等国家率先应用。AI主播依托虚拟合成、机器学习等技术的创新,是目前新闻领域人工智能技术应用发展的最新形态,为电视新闻业带来了新局面。2018年以来,全球人工智能主播不断加速研发脚步,推广应用于各行各业,中国相比于其他研发和应用市场有着独特的优势。2021年3月,新华社AI合成主播再次升级,实现了从演播室到新闻现场的“时空穿越”,在2022年全国“两会”期间,为观众带来了跨场景新闻报道的全新视听体验[4]。
人工智能主播的概念界定在学术界尚未有统一、固定的表述标准,呈现在大众眼前的又称“机器主播”“虚拟主播”“合成主播”等,因为不同时期人工智能技术的发展会有不断的更新,就会创新研发各种以智能机器替代(或部分替代)人类播报与主持任务为目的的科技产品[5]。AI主播这一概念基本涵盖了不同历史时期的各个形态,是在语音合成技术和人脸合成技术的基础上,结合语音、图像等多模态信息进行联合建模训练后,生成的人工智能分身模型[6];AI主播是AI技术与新闻媒体深度融合的产物,技术渗透至采集、输入、生产和传播等新闻制作的多个环节,成为电视新闻业备受瞩目、不断创新发展的前提。
AI主播源自“搜狗分身”技术。首先由一位真人主播面对镜头录制播报1个小时的新闻,接着用最新人工智能技术通过人脸关键点检测、人脸特征提取、人脸重构、唇语识别、情感迁移等多技术、结合语音、图像等多模态信息进行联合建模训练后,克隆出一个机器人分身。克隆出的“分身”与真人主播拥有同样播报能力。这不仅在全球领域实现了技术创新和突破,更是在新闻领域打造了一个实时音视频与AI真人形象[7]。
新兴技术的发展日新月异,科技创新的成果也在潜移默化地影响着我们的生活。AI技术以机器人的新形态出现在播音主持新闻领域,拥有着许多人类主播所不具备的先天性优势,在新闻传播领域开创了一个前无古人的先河。在实际应用过程中,它也凭借自身优势弥补人类的不足,成为行业争相研发的“宠儿”。
20世纪90年代,媒体的改革让记者、播音、主持三者融为一体,催生了新一代主持人,一个新的名词诞生——“主播”。随着互联网的兴起,不同国家开始研究“虚拟主播”,在不同年份以不同身份慢慢浮现在大众眼前。对人工智能主播源远流长的历史探索,其发展历程大致可分为萌芽、探索、应用三个阶段[8]。
AI主播萌芽阶段(2000—2004年)。人工智能主播最早源于虚拟主持人时代,起初研发目的是希望机器人能代替人类主播的部分工作,但实际上这一时期的机器人却呈现出稚嫩化、高成本的特点[9]。2001年,世界上第一个虚拟主持人“阿娜诺娃”诞生,是一个电脑生成的2D化虚拟动画人模,表情有些机械、僵硬。2004年,央视CCTV6频道推出了国内首位电视节目虚拟主持人“小龙”,从2D技术升级到3D技术,人物肢体动作和表情也有了一定的逼真形象水平。
AI主播探索阶段(2004—2018年)。人工智能主播发展了短短4年后,过渡到探索阶段,起初出现了暂时的停滞期,但随着视频网站的兴起,提供了更多新的应用平台,“虚拟主播”又逐渐发展起来。2016年日本率先推出了动漫虚拟主播“绊爱”(KIZUNA AI)。“绊爱”首次在YouTube上发表视频,它由真人扮演、3D建模、真人配音,主要借助面部、动作捕捉等技术捕捉真人动作及表情,语言表达和肢体动作都有明显的进步,从此便算是打开了浩浩荡荡的“大航海时代”。2016年,科大讯飞、搜狗及百度等科技公司不断钻研AI技术,突破了语音识别技术上的瓶颈,识别准确率一再创新高,大大提升了新闻播报工作效率,从而掀起了新一轮AI主播热潮。2017年,机器人“石榴娃”在西安广播电视台《西安新闻》的直播间惊艳亮相,更是科技大会宣传报道中引人瞩目的硬科技新亮点。2018年,“似曾相识”的虚拟主持人“康晓辉”以全动态的逼真形象出现在屏幕上。
AI主播应用阶段(2018年至今)。2018年,人工智能主播的发展以虚拟化、数字化的特征被广泛运用于全球。AI主播在中国掀起研发和应用热潮,按照其研发技术机构分类,主要有科大讯飞系、搜狗系和百度系三大系别,其中具体应用在新闻业的案例如下表所示。
表8-1 全球AI主播在新闻业的应用案例
资料来源:高维嘉根据中国新闻网、央视网、新华网等媒体官方网站信息资料整理。
2019年春晚,AI虚拟主持人团队诞生,凭借新闻文本进行实时播报,高度模拟人类。2020年,全球首位3D合成主播“新小微”亮相,实现了从多场景、精微表情播报等的进步,播报形态可通过不同角度的全方位呈现,立体感和层次感明显增强[10]。2021年,国家广电总局网站发布的《广播电视和网络视听“十四五”科技发展规划》中提到,要推动虚拟主播、动画手语广泛应用于新闻播报、天气预报等节目生产,创新节目形态,提高制播效率和智能化水平。为了响应政策,央视新闻联合百度智能云推出AI手语主播,直播奥运赛事,用技术跨越声音的障碍。2022年,科大讯飞正式启动“讯飞超脑2030计划”,将着力“软硬机器人”“数字虚拟人”等领域,让AI机器人得到推广应用。
随着人工智能技术的升级和发展,智能机器人在未来将会摆脱机械的标签,实现更多的自主学习,对新闻内容的深度解读和分析理解能力也会有所提升,并且将具备解决深度学习、场景理解、情感识别等更复杂的能力,由“人工智能”转型为“新闻智人”,或将真正达到“想你所想”的智能化程度[11]。