算法的透明度饱受质疑
2025年10月24日
二、算法的透明度饱受质疑
算法新闻是指由机器学习或者神经网络为技术基础而生产和分发的新闻,它的主要工作流程包括数据输入、吞吐和产品输出。[2]而如今人工智能算法的介入使得新闻生产流程全被纳入了人类无法识别的“生产黑箱”。我们不禁要问,算法搜集到的数据是否满足客观性的前提?机器生产新闻有可能报道整个事件吗?数据库的数据是由谁收集的?是如何收集的?这就涉及了新闻生产的透明度问题。
算法新闻的生产包括三个流程,即算法新闻的“I-T-O”模式:I是指数据输入(Import);T是指数据吞吐(Throughput);O是指新闻产品输出(Output)。在数据吞吐的阶段,数据处理技术的复杂性使得用户无法理解或得到准确的解释,从而产生“算法黑箱”。如今人工智能技术深入新闻传媒领域,更多的技术操作使得普通公众无法更好地理解新闻生产的流程,这更加深和加速了新闻生产的“黑箱化”。在这种“黑箱化”的生产流程里,自主化的决策系统只给出了结果,却没有提供做出这一决策所依据的材料和理由,因此人们无法判断信息是如何存储和运用的,非透明的新闻生产机制使得用户无法准确地辨认内容的真实性从而做出正确的判断。
Jenna Burrell在其论文《机器如何“思考”:理解机器学习算法中的不透明性》(How the Machine“Thinks”:Understanding Opacity in Machine Learning Algorithms)中论述了三种机器算法的不透明性:因公司商业秘密或者国家秘密而产生的不透明性;因技术文盲而产生的不透明性;以及从机器学习算法的特征以及要求将它们有效适用的测量中产生的不透明性。[3]在当下如何解释算法和机器学习成为一大难题,这种不透明性使人们很难了解其中的算法机制,尤其是对一个不懂计算机的普通人而言。