一、量化选股综述

一、量化选股综述

本章是本书的重点之一。对量化投资而言,择时、选择风格、资产配置都是非常难的,量化选股是相对容易的一个环节。择时的胜率其实是比较低的,好的择时能做到60%就已经非常不错了。但量化选股的目标是追逐阿尔法,在一个较长的时间段里,例如1年,取得阿尔法的难度要小很多。投资者可以查阅国内指数增强型基金,大部分都能战胜基准,而且从2012年开始,几乎每年都如此。对于投资,非常重要的是广度和准确率之间的关系。

图示

IR是衡量投资组合的重要指标,即超额收益/投资组合偏离基准收益的标准差,主要用来衡量超额风险所带来的超额收益。breadth代表独立的投资个数。这个公式说明了风险调整后的投资收益等于预测的准确性(IC)乘以投资广度的平方根。量化投资的优势在于投资广度,一个好的选股因子,IC能达到5%以上就不错了,但因为可以应用在上百的投资上,所以可以得到不错的IR。反观做基本面投资的,对IC的要求就高得多,因为广度上达不到很高,所以力求能够一局定胜负。

纵向来看,量化选股是整个量化投资体系里先发展起来的一个环节。早在20世纪80年代计算机开始普及的时候,华尔街的研究人员就尝试着用简单的计算机程序来选择债券和股票,也是巴尔·罗森伯格(Barr Rosenberg)开始创建现代量化选股旗舰软件BARRA的时候。到了20世纪90年代,采用量化选股的各类量化股票基金开始大行其道,在公募基金中的占比从0开始,一路狂飙到20%,诞生了像Dimensional Fund Advisors、State Street Global Advisors、Barclays Global Investors等超级大基金。同时,风格也从单纯的股票量化多头演变成股票多空、市场中性、指数增强、套利等多种形式。

2007年,随着金融危机的爆发,一些宣称“市场中性”的量化基金也遭受了较大回撤,被称为“Quant Meltdown”(量化崩盘)。股票市场中性策略的主要风险来自其模型,根据历史数据建立的模型通常很难长期有效,可能阶段性地失效,甚至不再有效,投资经理需要不断修正模型。同时,依赖数学模型的投资策略可能会因为策略趋同而出现意想不到的损失。2007年8月上旬,许多历史上非常成功的量化对冲基金突然出现大幅亏损,净值波动幅度远远超过历史平均水平。例如之前以业绩优异著称的文艺复兴科技公司就向投资者报告,旗下一只主要基金8月初损失达8.7%。重要原因就是当时主流量化模型类似,股票市场仍处于牛市,各家对冲基金基于类似研究成果建立的量化模型都给出了趋同的操作建议,短期内各家对冲基金获利颇丰。但许多对冲基金使用的是相同的第三方风险评估模型,根据模型评估结果,对冲基金又开始实施类似的风险调整。短期内大量类似的交易需求对市场造成了冲击,放大了对冲基金的损失。Quant Meltdown很快就平息了,但给投资者留下了不太好的印象,可谓“一丑遮百美”。

2007年之后,量化基金管理人开始思考其在金融危机中的表现,同时大分化出现:公募类型进行中低频率调仓(月度或双月度)的传统量化选股基金规模开始走平,没有太大的发展;而私募类量化基金开始突出其策略或者产品结构的独特性,像文艺复兴、桥水、二西格玛(Two Sigma)、城堡(Citadel)开始走强,策略逐步走向高频交易、套利等。但在公募领域里,指数基金和类指数的策略指数基金异军突起。金融危机之后,以贝莱德(BlackRock)、先锋(Vanguard)集团为代表的被动投资市场份额不断上升,直接挤压了传统主动基金和主动量化基金的市场份额,成为当前发达国家资产管理领域里最大的变革之一。(https://www.daowen.com)

我国的量化投资起步较晚,基本上可以分为三个阶段。

第一个阶段是2010年之前的初期探索阶段,彼时股指期货还没有上市交易,量化策略类型相对较少,公募基金产品以指数型基金为主。2004年,华夏上证50ETF上市交易,成为国内第一只ETF(交易型开放式指数基金)。之后的几年里,公募量化基金主要是指数和类指数产品。私募产品主要以信托方式存在,包括ETF套利基金和封转开套利等。在2010年之前,国内的证券公司是量化研究的主力,在产品设计、投资策略和衍生品上做了大量研究,为之后量化投资的迅速普及奠定了基础。

第二个阶段是2010—2015年指数增强和量化对冲类策略大发展。2008年,在美国次贷危机的影响下,海外量化基金人才大量回国,为市场提供了大量专业化人才。2010年4月,我国第一个股指期货沪深300期货开始在中金所交易,标志着对冲时代的正式来临。从2011年开始,量化基金快速发展。公募基金的专户产品里开始出现量化对冲专户的身影,同时越来越多的基金公司开始发行量化纯多头(主动)基金。2016年是量化基金全面收获的一年,在当年股票型基金收益排行榜里,有两个是量化基金;同时在量化基金里,出现规模过百亿的巨量基金。2012—2015年,是量化对冲类产品的大发展阶段,包括市场中性类和期现套利类策略。这一阶段的对冲类产品有两个阶段性的有利条件,一是期指的正基差,二是持续的小盘股风格,使产品收益非常突出,也获得了大量资金,尤其是稳健风险偏好资金的追捧。

第三个阶段是从2016年至今,期指限手制约量化对冲,量化策略类型逐渐丰富。2015年股灾之后,监管层对股指期货投资的监管力度加强,但金融衍生品的发展并没有因此停止,场内期权产品在2016年之后发展壮大,做到了目前名义成交量过百亿的规模。因此,管理人在其他方向上的拓展,进一步丰富了量化产品,比如CTA、期权策略、量化多策略、FOF(投资于其他证券投资基金的基金)等。此外,商品期权、原油期货等衍生品种陆续上线。在这个阶段,传统量化基金也开始转型。之前非常有效的一些选股因子,在2017年严重失效,使量化基金管理人开始思考之前构建研究模型的逻辑,公募量化基金的体系开始自我变革。同时,随着保险等大型机构投资者越来越青睐指数型产品,指数增强型基金在2017年之后进入规模增长期,2017—2018年增长了50%。

本书所提到的量化投资,除特别指出以外,都是以中低频率调仓为基础的,因为笔者身处公募基金公司,而公募基金对交易频率的要求是不能太高,也不能造成太高的交易成本。下文入门篇介绍一些简单的方法进行股票筛选,提升篇介绍BARRA的选股体系,最后介绍利用数据挖掘和基本面投资相结合等来选股的研究方法——最近几年兴起的新研究方法之一。