财经博客

财经博客

TipRanks是一家提供财经文本数据集的服务商,这家公司从不同途径收集了线上的投资建议,包括新闻文章和财经博客。TipRanks会根据自创的自然语言处理算法,通过对收集的文章用人工方式进行分类,然后给每篇文章生成看涨或看跌这样的投资情绪,由此产生买入或卖出的交易信号。

TipRanks收集的新闻文章观点和投资建议已经在汤森路透和慧甚这样的数据服务商提供的结构化数据中得以体现,而财经博客则发表在像Seeking Alpha和The Motley Fool这样的财经类社交媒体上。这些财经博客作为社交媒体不像推特那样影响广泛,但是上面发表的文章往往是长篇大作,涉及对公司商业前景的深入分析,因此这些财经博客更像是卖方分析师的研究报告,而不是新闻媒体的文章或者是微博。Jha(2019a)就对TipRanks整理的财经博客数据集进行了分析。

他首先采用了类似事件研究的方法,由此分析财经博客发表之后股价的变动,从而得到了图1.6的结果。这张图中显示的是博客文章发布前后的平均累计剩余收益,也就是说对行业和风险因子产生的收益进行了控制后得到的结果。从中可以看出博客文章对股市有很大的影响,而且在看涨文章发布之后出现了价格的上升,而在看跌文章发布之后出现了价格下跌。当然这一方面是文章自身产生的影响,另一方面也可能是发布日当天发生了重大公司事件导致的。

图1.6 财经博客投资建议的累积剩余收益

资料来源:Jha(2019a)。

TipRanks和Extract Alpha合作,共同开发了一套股票评分算法,由此得到TipRanks专家情绪信号(TipRanks Expert Sentiment Signal/TRESS)这个指标。它的计算方法很简单,就是把一篇看多的文章标记为+1,而一篇看空的文章标记为-1,然后针对特定的股票计算所有文章的加权和,其中权重根据文章发表的天数来确定。这样得分最高的股票就是那些近期得到很多买入建议的股票,而得分最低的股票则是那些近期得到很多卖出建议的股票。最后为了弭平股票得到的投资建议数量之间的差异,比如大盘股和广受瞩目的股票往往得到的建议就比较多,针对特定股票发表的博客文章频率进行了比例调整。最终TRESS分值介于1到100之间。[14]

接下来构造基于TRESS指标的多空组合,也就是在TRESS指标介于91~100之间的股票上持有多头仓位,同时在1~10之间的股票上持有空头仓位,同时用做空股票得到的收入来构建多头仓位,由此保持投资组合的市场中性特征。这样的投资组合得到的投资绩效如图1.7所示。

图1.7 基于TRESS指标的市场中性组合绩效