位置数据

位置数据

Advan是一家专注于地理位置数据的智能服务商,它通过跟踪智能手机的位置可以监控实体商店客流量的信息。在客户许可的情况下,在手机上安装地理位置的应用程序就可以通过Wi-Fi、蓝牙或者蜂窝信号来跟踪手机用户的位置。

Advan收集并且整理的地理位置数据可以用来表征相关上市公司的收入,特别是零售企业的销售收入。在2017年,这个数据集已经覆盖了美国30%的人口,每天可以收集大约2500万台设备的收据,涉及超过100万个实体地点,其中大约有近50万个实体地点会有人工审核。这些数据可以映射到381只股票上。这些股票有80只是标普500指数中的成分股,涉及零售、大卖场、超市、酒店、医院、餐厅、影院、游乐场、便利店和快餐公司等。

摩根大通的Kolanovic/Krishnamachari(2017)分析了Advan的一个数据集,涉及6.5GB的数据,包含了上面所说的标普500指数中的80只成分股。这些原始数据在以下层面进行了汇总:

·股票代码层面,在股票代码也就是上市公司层面进行汇总;

·商店层面,对每个商店的位置计算客流量;

·设备层面,在每个商店和停车场,带有时间戳、在店/离店时间以及准确位置信息;

·设备向量层面,每台设备在一天之内游逛过的所有位置向量。

数据集还包含了可以跟踪地理位置的1000个顶级应用程序列表,对应证券的主文件,以及用于生成数据的程序。下面给出了基于原始客流量信息的信号生成的过程:

(1)排除某台设备在同一天内访问同一家商店中的重复计算问题。

(2)在应用程序中,把具有SDK标示的应用程序在所有应用程序列表中设定为1,[30]然后把要进行分析的应用程序限定在具有上述特征以及至少连续360天都有数据的应用程序上。

(3)根据下面的指标计算每日的客流量(Tra):

这里De表示在某一天根据应用程序所确定的设备总数;Ra表示对应于特定公司的商场内部出现的设备相对于设备总数(De)的比率。

(4)接下来根据客流量指标计算下个季度销售收入的预测值(Sales):

其中Qi+1Qi分别表示第i+1和第i个季度的天数。

(5)公司公布的销售收入数据来自彭博,分析师的收入估计数据则来自慧甚。

现在考虑如下的股票量化策略。首先是构造两个股票篮子,一个是绩效优良篮子,其中包括销售收入预测值大于分析师收入估计值的股票;另外一个是绩效不良篮子,其中包括预测值小于分析师收入估计值的股票。在某个季度之后的两天在获取相关数据中构建仓位,做多绩效优良篮子中的股票,同时做空绩效不良篮子中的股票,这样的多空组合采用等权重的方式,然后一直持有到公司公告日发布之后的5天。表1.11报告了上述投资策略的绩效。结果表明绩效优良篮子组合会打败标普500指数,而绩效不良篮子组合则劣于标普500指数。这里需要指出的是,多空组合在投资收益上的差异是由绩效优良篮子和绩效不良篮子两个组合收益的差异形成的。考虑到后者的差异为正,因此多空组合的收入就比绩效优良篮子纯多头组合的收益低。但是Kolanovic/Krishnamachari(2017)指出,多空组合和标普500指数之间的相关系数只有0.7%,这近乎就等于0。因此多空组合和市场组合之间就存在着显著的分散化效果。

表1.11 基于客流量数据的多头、空头和多空组合投资业绩