算法分发的出现及在传媒行业的应用

(一)算法分发的出现及在传媒行业的应用

算法分发机制是以云计算为技术支撑的计算机科学在新闻领域的创新应用。云计算是以虚拟化技术为基础,以网络为载体,以提供基础架构、平台、软件等服务为形式,整合大规模可扩展的计算、存储、数据、应用等分布式计算资源进行协同工作的超级计算模式。[29]因而算法机制首先是以技术整合升级为目标的计算科学,而后在新闻行业的应用使其承载并具备了新闻生产与传播的部分属性。应用在传媒行业内容传播领域的算法分发技术,工作原理可概括为数据收集、数据分析、画像生成、信息匹配、精准分发五个步骤,简言之就是通过追踪用户的网络行为,运用一些数学算法计算出个人特征、环境特征等相关信息,并推测出用户可能喜欢的内容。

算法分发技术在新闻传播领域的大热离不开移动互联网、大数据、云计算和人工智能科技的发展。总的来说,西方世界对新闻算法推荐技术的应用要早于中国,其应用范围也更加广泛。Facebook和谷歌等较大的互联网公司早已在新闻搜集、分发和推荐过程中应用算法技术。一些新型技术公司,例如美国伊利诺伊州的叙述科学公司(Narrative Science)和北卡罗来纳州的自动化洞察力公司(Automated Insights),也是较早通过算法技术来生产各种经济、体育资讯的行业实践者。另外,传统新闻单位也在不断尝试运用算法技术,但是和互联网科技公司相比,还存在着较大的差距。

算法的历史,最早可追溯到1992年。当年,美国施乐公司的科学家提出了Tapestry系统。[30]该系统用于帮助员工筛选分类大量的电子邮件。1994年,美国明尼苏达大学双城分校的GroupLens项目组开发了一个新闻筛选系统,[31]这个系统可以帮助新闻的阅听者过滤出其感兴趣的新闻内容,阅听者看过内容后给一个评比的分数,系统会将分数记录起来以备未来参考之用,前提是阅听者以前感兴趣的东西在未来也会有兴趣阅听,若阅听者不愿揭露自己的身份也可以匿名进行评分。作为最老牌的内容推荐研究团队,GroupLens于1997年又开发了电影推荐系统MovieLens,还有性质相近的音乐推荐系统Ringo,以及影音推荐系统Video Recommender等。

在新闻筛选系统出现不久后,算法分发技术又建立了另一个里程碑——电子商务推荐系统。1998年亚马逊公司上线了基于物品的协同过滤算法,将推荐系统推向服务千万级用户和处理百万级商品的规模,并能产生质量良好的推荐。[32]

伴随着算法分发技术在实际场景中的应用,一些内容生产公司开始意识到这样一个问题,面对信息过载的环境和碎片化的信息消费场景,高效准确地寻找到自己需要的信息是一件并不容易的事情。以往用户搜寻信息主要借助的是搜索引擎这一工具,但是这一工具适用的前提在于用户已经对自己的信息寻求有了较为明确的认知。如果用户无法准确描述自己的信息搜索需求,甚至对自己的需求都不了解时,就需要一个能够主动根据我们的兴趣和需求来分发信息的方案。新的信息环境和人类的信息需求,呼唤一种新的信息分发解决方案,同时移动互联网的发展也为用户的个性化内容定制创造了物质条件——每个人都是一个终端,这使得信息的分发能够定位到每一个用户。

基于这一背景,2006年Facebook正式推出NewsFeed项目。Facebook借助算法调整用户打开平台之后看到的一切内容,这些内容不仅包括朋友的状态更新、朋友最近看了些什么、重要新闻推送,而且还在其中夹杂了不少原生广告或软文。这些用户所看到的内容都是通过机器对用户习惯的分析所进行的智能推荐。NewsFeed取得巨大成功,成为社交网络有史以来最重要的发明,重构了我们和个人信息之间的关系,改变了我们发送给朋友的图片和状态,也定义了广告的新形式。

伴随Facebook、Twitter、Instagram等社交平台的进一步发展,这些平台覆盖越来越多的用户,内容分发的去中心化特征日益凸显:每个人都可以创作内容从而成长为自媒体,每个人都可以借助社交关系评论、转发从而完成内容的传播。信息的传播权从传统的精英编辑让渡给每个普通用户。在社交平台上,用户往往通过社交信息流追踪社交网络中的新动态,社交平台纷纷将“社交信息流”界面作为重要的用户流量和广告营收入口。然而随着用户规模扩大,用户生产的内容出现过载,传统的按发布时间反向顺序呈现信息流的模式,已经不能高效地为用户提供优质内容,也不利于平台的商业化运营,因此在社交信息流的呈现逻辑上,越来越多的社交平台摒弃传统的时间线主导模式,主动介入信息流的筛选排序环节,通过人工智能算法为用户过滤形成定制化的信息流,以期促进用户信息消费和再生产,进而增加用户黏性和广告收入。

皮尤研究中心在2016年的调查报告中显示,美国成年人中有62%通过社交媒体获取新闻,18%高度依赖社交平台,通过Facebook阅读新闻的人数占比高达44%,这也在很大程度上说明了“社交分发”已经成为主流的分发方式。[33]在这一趋势之下,智能化社交信息流开始被业界广泛采用,社交平台Twitter和Tumblr均于2015年采用“while-you-were-away”的系统为用户筛选呈现其离线期间的信息。[34]随后,知乎、Instagram等社交平台也引入智能化的社交流设计改变用户社交信息的流向规则。总体而言,算法分发的出现和普遍应用,意味着人类开始运用机器大规模地解决信息分发问题,人类社会信息分发的动力从人力转向了部分自动化——从“人找信息”,到“信息找人”。

目前的主流算法推荐类型有协同过滤算法、基于内容的推荐和基于语义的推荐三种。

1.协同过滤算法

这是一种较为常用的推荐算法。它基于对用户历史行为数据的挖掘发现用户的喜好偏向,并预测用户可能喜好的产品。这种推荐本身是基于行为的推荐,用户必须在平台上留有大量的行为数据特别是对于推荐商品是否点击的反馈数据,才能够形成有效的推荐。

2.基于内容的推荐

这跟新闻、媒体的推荐有关系。它基于用户历史浏览内容的标签以及用户自身的标签进行匹配,从而实现推荐。影响这种推荐得以实现的重要因素在于平台能否形成对于用户和待推荐内容的精准理解以及精准的匹配机制。

3.基于语义的推荐

随着推荐技术的升级,算法推荐越来越多地过渡到语义的推荐,这一类的推荐是当下的研究热点,它不强调字面上的匹配,而是进行相似语义的配对。例如经常看姚明的用户,可能对中国篮球明星感兴趣,那么与易建联相关的新闻也值得推荐。

为了实现更加精准的内容推荐,平台已不再满足只把握用户产生的行为,开始探索产生行为的原因。越来越智能化的技术通过用户片断式的行为,揣测用户背后的意图、场景和动机。就目前来看,行为和语义相融合成为明显的趋势。