计算未来收益和协方差阵

计算未来收益和协方差阵

在进行前两步工作之后,就可以在每一个预测期,根据每只股票新的因子载荷来进行收益预测,目的是生成风险控制下的组合。这个组合是一个有约束条件下的二次优化模型:

图示

其中,w为待求解的组合权重向量。

该优化问题的目标函数为最大化组合经风险、成本调整后的收益,具体包括三个部分:收益项、风险项、成本项。

图示为组合预期收益,r为股票预期收益率向量,在做完因子收益的计算之后,r就容易得到了。

图示项为组合风险,Σ为股票收益率协方差矩阵;λ为风险厌恶系数,决定风险与收益的权衡。

图示为调仓成本,w0为调仓前的持仓权重。

约束条件包括对组合风格因子暴露、行业分布以及个股权重的约束:

﹡第一个约束条件限制了组合相对于基准指数的风格暴露,X为股票对风格因子的因子暴露矩阵,Sl,Sh分别为风格因子相对暴露的下限、上限,wb为基准指数的权重向量。

﹡第二个约束条件限制了组合相对于基准指数的行业偏离,H为股票的行业暴露矩阵,当股票j属于行业i时,Hij为1,否则为0;hl,hh为组合行业偏离的下限、上限。

﹡第三个约束条件限制了卖空,并且限制了个股权重上限l

﹡第四个约束条件要求权重和为1。

如果做多因子选股,应该采取一定手段使生成的股票组合权重和基准权重一致,否则生成的股票组合就有可能在行业配置上严重偏离原始组合,容易出现组合风险过大,不好预测和控制的情况。如果控制住行业权重的偏离,那么相当于组合在行业上是零偏离的,没有因过度配置某个行业而造成风险加大。

事实上,不仅行业配置应该遵循这个原则,在风格上也应该遵循这个原则。什么是风格呢?我们常听说“把握小盘股的机会”,用市值来划分,大、小盘就是一种概念,具体数值化也可以作为一种因子。怎么看风格呢?可以预测的、持续稳定的风格因子,可定为一种阿尔法,是驱动股价长期上涨的因素;不可预测的、不稳定的风格因子,就是一种风险,需要控制。

在上述模型中,协方差矩阵Σ的预测是非常关键的。在收益率服从正态分布的假设下,样本协方差是无偏的极大似然估计量,即给定数据下最可能的参数,也就是说“完全让数据说话”。在估计参数时,如果样本数量足够大,那么样本协方差具有良好的性质;而在小样本下,使用该估计量可能会出现过拟合。

样本协方差矩阵为:

图示

其中1为元素全为1的列向量(N×1),I单位矩阵(N×N)。从样本协方差的计算公式可以看出,样本协方差S的秩最多等于矩阵图示的秩,即T-1。因此,当矩阵的维数N超过T-1时,样本协方差矩阵是不满秩的,也是不可逆的。

此外,在样本协方差矩阵中,需要估计图示个元素,而总样本量为N×T。在实际应用中,由于收益序列的非平稳性,通常不会取较长的时间区间;而待求解的股票集合往往很大。因此,当股票数量的数量级与样本数量相当,甚至更大时,样本数量的缺少给样本协方差带来较大的估计误差。天风证券研究者曾提出改进股票收益率协方差估计的方法有因子模型、压缩估计、随机矩阵理论模型等,其中效果最好的是压缩估计方法,因子模型相对而言效果一般,但入手比较简单。(https://www.daowen.com)

﹡因子模型。可以通过给协方差矩阵加以一定的结构,从而减少数据的维数,降低估计误差。这种结构可以来源于因子模型,如单一指数模型(市场模型)、多因子模型(行业因子、宏观因子、基本面因子、统计因子)。然而,因子模型的缺陷在于,关于模型中应当包含几个因子、包含哪些因子,并没有统一的标准。因此不能提前知晓在特定环境下应该使用什么模型,这就使因子模型的设置往往具有一定的“艺术性”。

﹡压缩估计。为了避免因子模型中的因子选择问题,可以将样本协方差矩阵与其他结构化模型进行加权,以此来设定结构。

﹡随机矩阵理论模型。除了在估计中引入结构化,也可以根据随机矩阵理论来分离样本协方差矩阵中的信息与“噪声”,即通过调整相关系数矩阵的特征根来降低协方差矩阵的估计误差。

下文简单展示用压缩估计模型来预测组合的协方差,有兴趣的人可以参考相关研究报告,进一步研究。

关于组合风险的估计,当股票特质收益率与公共因子不相关时,预期风险可以分解为公共因子解释的风险和特质风险,其中公共因子风险使用日度因子收益的协方差矩阵、因子暴露估计,特质风险使用个股特质收益率的波动率估计,即:

Σ = XFXT+∆

其中,Fk个因子(风格因子与行业因子)的因子收益协方差矩阵,Xn只股票在k个因子上的因子暴露矩阵(n×k),∆为股票的特质波动率矩阵(n×n)。

因子收益协方差、特质风险都使用半衰加权计算,给近期的因子波动更高的权重,下面介绍具体估计方法。

因子收益加权协方差可以直接根据因子收益序列计算得到:

图示

其中,σi,j为因子i和因子j的半衰加权协方差,wt为半衰权重,图示为因子i半衰加权的因子收益均值。然而,考虑到因子收益之间的相关系数比因子波动更加稳定,先分别估计因子收益的相关系数和各因子的波动性,再计算因子协方差矩阵。因子收益协方差可由因子收益波动率及因子收益相关系数计算得到:

图示

其中,σiσj分别为因子ij的因子收益标准差,ρi,j为因子ij的因子收益相关系数。

这种估计方法的优点是可以对因子收益相关系数、因子波动使用不同的半衰期进行加权计算。由于因子相关系数较稳定,可以选择较长的半衰期;因子波动变化较大,可以选择较短的半衰期,从而更加迅速地反映因子风险的变化。当因子相关系数与因子波动的半衰期相同时,通过这样的方法得到的因子收益协方差矩阵与直接使用因子收益计算的加权协方差矩阵是一样的。

特质风险为特质收益率的方差:

图示

其中,图示为股票n特质收益率的方差,wt为半衰权重,fu,n,t为股票nt期的特质收益率,图示为股票n特质收益率的半衰加权均值。根据时间序列估计的特质波动率在样本外不一定具有持续性,尤其是当特质波动率特别高或者特别低时,特质风险存在均值回复的可能性,因此需要对特质风险的估计值进行调整。