电话会议记录

电话会议记录

在前面的三个文本数据案例中,推特推文反映了普通投资者的情绪,财经博客反映了财经专家的情绪,而财经新闻则体现出记者们的情绪。在这个小节所介绍的文本数据案例中,我们将讨论另外一类文本数据中的情绪,也就是公司电话会议记录中体现的管理层情绪。这个案例来自于ExtractAlpha和AlphaSense这两家公司的分析师Jha/Blaine(2015)。

财务文件的文本分析在学术研究中已有经年,包括Loughran/McDonald(2011)针对美国公司年报10K和季报10Q的文本分析,以及Henry(2008)针对公司会议记录进行的文本分析,Kearney/Liu(2014)对此做了一个很好的综述。当前这个案例所说的财务电话会议记录(earnings call tanscript),其来源是因为公司股东分散各地,因此经常需要通过电话进行会议,而这些会议过程通常会录音,形成文字后就是电话会议记录了。

大多数财务报告(10K和10Q)表现为数值数据以及标准模板陈述的文字,其中很少涉及情绪方面的表达,其中和情绪最为相关的管理层讨论和分析,也只占财报中很小一部分。和财报相比,公司的电话会议记录更具自发性,格式更为随意,特别是问答部分,在现场实时环境下,管理层必须要做即席的回答。在这个案例中,我们可以捕捉管理层在应对股东提问中所体现的情绪,特别是股东问题本身所蕴含的情绪。在Loughran/McDonald(2011)的研究中,他们就依托于一个针对特定文件中语言使用方式相关的词典。针对电话会议记录中的情绪,专注于市场智能研发的AlphaSense就开发了一个针对电话会议记录的正面和负面词汇的词典。这个案例分析的电话会议记录数据是由汤森路透提供的,最早可以追溯到2005年。Jha/Blaine还对慧甚提供的电话会议记录数据进行了类似的分析,结果得到了在性质上近似的结论。

作者分析的时段是从2005年到2014年,所覆盖的股票要求满足流动性的要求,[22]由此在不同的样本时段上就得到了1400~1800个的股票样本。在这个案例的文本情绪分析中,Jha/Blain(2015)把重点放在了会议记录语调(tone)这个指标上。根据AlphaSense开发的针对电话会议记录的正面和负面词汇的词典,就可以得到语调的定义:

在样本中语调的数值介于-0.04和0.62之间,中位数是0.25。一个电话会议记录的语调值是0.25,就意味着这个文件中正面词语的句子要比负面词语的句子多出25个句子。在这个样本中,很少存在语调为负的情况。不同时期的语调分位数是非常稳定的,除了在金融危机发生的时候出现明显的下跌。图1.8给出了每月语调第10、25、50、75和90百分位数的变化。

图1.8 语调百分位数的时间序列

资料来源:Jha/Blaine(2015)。

下面分析语调变化的投资含义。图1.9所示为各种不同语调变化带来的累积剩余收益。我们可以看到,在公告日当天不同的语调变化存在着明显的股票收益率差异,正如所预期的那样,越正面的语调变化就会存在更大的股票回报。如果我们不知道公司电话会议的具体实践,或者会议记录的发布存在着延迟,那么就无法获取当日的股票收益。另外,在第二天之后,语调变化带来的收益变化不是很大,除了最为负面的语调变化,后者会出现股票收益在未来两个月内持续下跌的状况。

图1.9 从会议记录日开始基于语调变化的剩余收益

资料来源:Jha/Blaine(2015)。

接下来我们在投资组合场景下讨论语调的影响。作者分别从全体股票样本、大盘股、中盘股和小盘股的分类出发,分别构造基于语调变化的股票十分位投资组合,然后通过做多最高十分位和做空最低十分位的组合形成多空组合,由此得到表1.7的结果。从中可以看出,由此形成的市场中性组合收益率是适中的,但是对于大盘股和中盘股而言这个组合的投资业绩是不多的,当然对于小盘股而言,投资业绩就很一般了。就这个结果,作者也指出,对于小盘股而言,电话会议的内容在时间上的变化很大,因此语调的季度自相关系数就很低,这样语调的变化就更多是噪声,而不是由于电话会议参与者对公司前景看法的变化导致的。

表1.7 基于语调变化因子的多空组合绩效