线上消费需求数据
前面我们介绍的另类数据案例中,财经博客可以对公司的基本面信息给出见解,而商品交易数据则可以更为直接地表征这些公司信息。在这两类另类数据集之间,我们还可以分析有助于了解消费者偏好的数据,而基于网络的需求数据就可以满足这样的要求。ExtractAlpha的首席执行官Jha(2019a)和摩根大通分析师Kolanovic/Smith(2019)就讨论了一个这样的数据集针对股市投资的含义。
随着现代人花费越来越多的时间在网上,消费者不仅在线上购买商品,而且还会在购买商品之前在线上对这些商品进行研究。因此对公司产品的需求可以通过对公司网络的关注程度来表示。有些时候这种关注会是负面信号,比如公司发生的丑闻,但是更多的文献表明,更多对公司的关注对于公司而言是一件好事情。
这种关注度数据在数字营销领域已经应用经年,但是在股票投资领域相对来说比较新。在这方面alpha-DNA就是一个专注于数字化需求数据领域并且服务于投资机构的专业服务商。图1.16表明alpha-DNA提供的数据集覆盖了如下三个领域的消费关注数据:
(1)网络搜索:消费者是否通过搜索引擎在线上搜索某家公司的品牌和产品。
(2)网站:消费者是否会访问公司网站。
(3)社交媒体:消费者是否在某家公司各个社交媒体界面上通过喜欢、追随等方式表达他们的关注度。
根据alpha-DNA分析师Muthupalaniappan-Fertig(2017)撰写的报告,从规模上看,这家公司每个月会跟踪高达750亿次的消费者线上数字化互动行为,从中分析商业活动的变化。
图1.16 alpha-DNA数字化数据管理平台
资料来源:Muthupalaniappan-Fertig(2017)。
Alpha-DNA建立了一个特别的数据库,它的名字叫“数字局”(Digital Bureau),并且在持续维护和更新,它的功能就是给众多公司确认数字身份(digital identities),包括公司的品牌和产品名称,以及网页和社交媒体账户等。这些资料需要持续性的人工更新,同时原始的数字数据还需要进行清洗和整合,从而形成和每个数字实体关联的时间序列。此外还需要对一家公司拥有的所有数据实体进行整合,由此统一到唯一的股票代码上,这其中要涉及比较复杂的加权方式和算法。基于这个特别的数据集,alpha-DNA就开发了一个特有的评分系统。通过分析各家公司在网站、搜索引擎和社交媒体这些数字平台上的总体表现以及消费者渗透率、参与度和人气等指标刻画的消费者效度,这个评分系统就可以对所覆盖的公司进行排名。排名每天进行,同时最早可以追溯到2012年。这种“综合民意”(poll of polls)方法可以把来自多个数据集的很多不同数字维度信息源有效地组合在一起。基于这种方法,alpha-DNA就和ExtractAlpha合作,共同开发了数字收入信号(digital revenue signal/DRS)这个指标,它融合了线上多种不同类型的数字绩效指标。
DRS这个指标背后的原理是,当消费需求增强时,公司的收入就会超过市场预期;而当消费需求下跌时,公司的收入就会不如市场预期。而证据表明DRS的确可以预测某家公司收入超出市场预期的可能性以及超出市场预期的幅度,[27]后者可以称之为收入意外(revenue surprise),也就是真实收入和预期收入之间的差额。图1.17表明,从2012年到2015年的初始样本时段,DRS指标排在最后面的10%股票超出市场预期的只有40%,而排在最前面的10%股票超出市场预期的则超出了70%,而处于中间分位的股票打败市场共识的可能性随着DRS的上升呈现单调递增的趋势,如图中线段1所示。与此同时,这种趋势在2015年之后的的各个季度依然稳定地存在,如图1.17中其他线段都呈现往右边递增的趋势。这张图充分证明了DRS这个指标背后的原理。
图1.17 DRS十分位排序后公司收入超出市场预期的百分比
资料来源:Kolanovic/Smith(2019)。
接下来我们要讨论的就是DRS这个对基本面信息的预测指标可否在量化策略中表现良好。现在构造一个多空市场中性组合,也就是做多DRS处于最高十分位的股票,同时做空DRS处于最低十分位的股票,图1.18就刻画了这样一个组合从2012年到2019年初的投资业绩。它表明在大部分市场条件下,基于线上数字化信息形成的对于公司基本面的预测可以得到不错的投资业绩。
图1.18 基于DRS的市场中性组合累计收益率
资料来源:Kolanovic/Smith(2019)。