智能主播:快速生成新闻,颠覆既有传播模式

六、智能主播:快速生成新闻,颠覆既有传播模式

智能主播成为视频新闻报道的创新领域之一。一项技能是“克隆”与真人主播具有同样播报能力的“分身”,通过人脸关键点检测、人脸特征提取、人脸重构、唇语识别、情感迁移等多项前沿技术,并结合语音、图像等多模态信息进行联合建模训练后,“克隆”成任意一位主播,并且可以在任意时刻将同一形态分身在不同播报现场同时播报不同的新闻。这项技术让机器做到逼真地模拟人类说话时的声音、嘴唇动作和表情,实现自然匹配。未来,AI主播将成为新闻报道中的重要一环,与真人主播一起协同工作,提升新闻的制作效率,降低制作成本。

智能技术的快速发展也带来视听领域各类深度伪造(Deepfake)现象的出现。该技术的兴起主要源于生成对抗网络(GAN)的出现和发展。研究人员使用大量人脸图像训练GAN,使其掌握人脸图像中眼睛、鼻子、嘴巴及表情等特征。在新输入图像与视频后,GAN会对人脸特征进行捕获,并完成面部图像的替换与操纵,使用计算机对视频中的多个单帧进行批量处理即可生成深度伪造视频。当前主要有四种类型:第一种是借助软件更换面部,也是目前为止用得最多的;第二种是操纵人脸动作,重塑表情、口型和速度,让其发表非其真实意图的言论;第三种是创建在现实生活中并不存在的面部图像;第四种是将面部表情与声音结合,借助深度学习创建声音模型。