8.1　人工智能主播的诞生背景与发展历程

2025年09月26日

版权

以人工智能主播为例，它的出现引起了社会各界的广泛关注，开创了新闻报道的新格局。那么人工智能主播究竟使新闻报道的生产方式发生了怎样的变化？针对AI主播的优势与在新闻业中的具体应用现状展开研究和分析，未来的电视新闻行业在迎来新的考验和挑战的同时，新的发展空间和机遇亦在酝酿之中。

人工智能主播（AI主播）的理念发轫于英国，并在中、韩、日、美等国家率先应用。AI主播依托虚拟合成、机器学习等技术的创新，是目前新闻领域人工智能技术应用发展的最新形态，为电视新闻业带来了新局面。2018年以来，全球人工智能主播不断加速研发脚步，推广应用于各行各业，中国相比于其他研发和应用市场有着独特的优势。2021年3月，新华社AI合成主播再次升级，实现了从演播室到新闻现场的“时空穿越”，在2022年全国“两会”期间，为观众带来了跨场景新闻报道的全新视听体验^[4]。

人工智能主播的概念界定在学术界尚未有统一、固定的表述标准，呈现在大众眼前的又称“机器主播”“虚拟主播”“合成主播”等，因为不同时期人工智能技术的发展会有不断的更新，就会创新研发各种以智能机器替代（或部分替代）人类播报与主持任务为目的的科技产品^[5]。AI主播这一概念基本涵盖了不同历史时期的各个形态，是在语音合成技术和人脸合成技术的基础上，结合语音、图像等多模态信息进行联合建模训练后，生成的人工智能分身模型^[6]；AI主播是AI技术与新闻媒体深度融合的产物，技术渗透至采集、输入、生产和传播等新闻制作的多个环节，成为电视新闻业备受瞩目、不断创新发展的前提。

AI主播源自“搜狗分身”技术。首先由一位真人主播面对镜头录制播报1个小时的新闻，接着用最新人工智能技术通过人脸关键点检测、人脸特征提取、人脸重构、唇语识别、情感迁移等多技术、结合语音、图像等多模态信息进行联合建模训练后，克隆出一个机器人分身。克隆出的“分身”与真人主播拥有同样播报能力。这不仅在全球领域实现了技术创新和突破，更是在新闻领域打造了一个实时音视频与AI真人形象^[7]。

新兴技术的发展日新月异，科技创新的成果也在潜移默化地影响着我们的生活。AI技术以机器人的新形态出现在播音主持新闻领域，拥有着许多人类主播所不具备的先天性优势，在新闻传播领域开创了一个前无古人的先河。在实际应用过程中，它也凭借自身优势弥补人类的不足，成为行业争相研发的“宠儿”。

20世纪90年代，媒体的改革让记者、播音、主持三者融为一体，催生了新一代主持人，一个新的名词诞生——“主播”。随着互联网的兴起，不同国家开始研究“虚拟主播”，在不同年份以不同身份慢慢浮现在大众眼前。对人工智能主播源远流长的历史探索，其发展历程大致可分为萌芽、探索、应用三个阶段^[8]。

AI主播萌芽阶段（2000—2004年）。人工智能主播最早源于虚拟主持人时代，起初研发目的是希望机器人能代替人类主播的部分工作，但实际上这一时期的机器人却呈现出稚嫩化、高成本的特点^[9]。2001年，世界上第一个虚拟主持人“阿娜诺娃”诞生，是一个电脑生成的2D化虚拟动画人模，表情有些机械、僵硬。2004年，央视CCTV6频道推出了国内首位电视节目虚拟主持人“小龙”，从2D技术升级到3D技术，人物肢体动作和表情也有了一定的逼真形象水平。

AI主播探索阶段（2004—2018年）。人工智能主播发展了短短4年后，过渡到探索阶段，起初出现了暂时的停滞期，但随着视频网站的兴起，提供了更多新的应用平台，“虚拟主播”又逐渐发展起来。2016年日本率先推出了动漫虚拟主播“绊爱”（KIZUNA AI）。“绊爱”首次在YouTube上发表视频，它由真人扮演、3D建模、真人配音，主要借助面部、动作捕捉等技术捕捉真人动作及表情，语言表达和肢体动作都有明显的进步，从此便算是打开了浩浩荡荡的“大航海时代”。2016年，科大讯飞、搜狗及百度等科技公司不断钻研AI技术，突破了语音识别技术上的瓶颈，识别准确率一再创新高，大大提升了新闻播报工作效率，从而掀起了新一轮AI主播热潮。2017年，机器人“石榴娃”在西安广播电视台《西安新闻》的直播间惊艳亮相，更是科技大会宣传报道中引人瞩目的硬科技新亮点。2018年，“似曾相识”的虚拟主持人“康晓辉”以全动态的逼真形象出现在屏幕上。

AI主播应用阶段（2018年至今）。2018年，人工智能主播的发展以虚拟化、数字化的特征被广泛运用于全球。AI主播在中国掀起研发和应用热潮，按照其研发技术机构分类，主要有科大讯飞系、搜狗系和百度系三大系别，其中具体应用在新闻业的案例如下表所示。

表8-1　全球AI主播在新闻业的应用案例

pagenumber_ebook=237,pagenumber_book=222

资料来源：高维嘉根据中国新闻网、央视网、新华网等媒体官方网站信息资料整理。

2019年春晚，AI虚拟主持人团队诞生，凭借新闻文本进行实时播报，高度模拟人类。2020年，全球首位3D合成主播“新小微”亮相，实现了从多场景、精微表情播报等的进步，播报形态可通过不同角度的全方位呈现，立体感和层次感明显增强^[10]。2021年，国家广电总局网站发布的《广播电视和网络视听“十四五”科技发展规划》中提到，要推动虚拟主播、动画手语广泛应用于新闻播报、天气预报等节目生产，创新节目形态，提高制播效率和智能化水平。为了响应政策，央视新闻联合百度智能云推出AI手语主播，直播奥运赛事，用技术跨越声音的障碍。2022年，科大讯飞正式启动“讯飞超脑2030计划”，将着力“软硬机器人”“数字虚拟人”等领域，让AI机器人得到推广应用。

随着人工智能技术的升级和发展，智能机器人在未来将会摆脱机械的标签，实现更多的自主学习，对新闻内容的深度解读和分析理解能力也会有所提升，并且将具备解决深度学习、场景理解、情感识别等更复杂的能力，由“人工智能”转型为“新闻智人”，或将真正达到“想你所想”的智能化程度^[11]。

8.1 人工智能主播的诞生背景与发展历程

8.1　人工智能主播的诞生背景与发展历程