公司文化数据
在新古典经济学的分析框架中,长久以来“文化”(culture)是一个被忽略和避免使用的术语。因为如果采用文化这种方式来解释经济现象,那就会被认为是一种逃避现实的方法,是人们不愿意努力找到真正经济答案的偷懒做法。一方面,这是经济学中萨缪尔森革命的结果。萨氏给经济学带来了严格的数学规范,从而在经济学中对任何无法用数学方程刻画的东西都会产生怀疑。另一方面,“文化”一词本身具有模糊性。按照Steinmetz(1999)的说法,文化有160多种定义。当某个术语过于灵活时,它就没有什么用处了。换句话说,如果它能解释一切,那么它实际上什么也解释不了。
这种现象在过去10多年发生了很大的变化。按照Zingales(2015)的说法,就是在经济学中出现了“文化革命”(cultural revolution)。这场革命是两方面的原因造成的,首先是传统经济学无法解释现实,这就让经济学家只能从其他维度去寻找答案。比如Guiso et al.(2006)就发现,在美国的瑞典裔和意大利裔似乎继承了他们母国人群在经济行为上的差异。另外,经济学家也开始对文化的定义有了一致的看法,并且研发出一套分析分化影响的方法,这就让文化不再是解决传统经济学无法解释的剩余问题。按照Guiso et al.(2006)的说法,经济学中文化的定义是“种族、宗教和社会群体代代相传和基本不变的习俗信仰和价值观”。这个定义所强调的信仰(和先验判断有关)以及价值观(和偏好有关)就让文化精巧地融入新古典经济学中,因为后者往往对于先验信念和偏好的来源采用了不可知的态度。
相比经济学,文化革命进入金融领域要更晚一些。但是金融领域给文化分析提供了更大的视角和机会。因为除了文化的社会维度,金融中还存在着文化的企业维度以及这两种之间的互动关系。公司是一个微型社会,但是根据Guiso et al.(2015b)的说法,微型社会具有更好地塑造文化的能力,而这是大部分国家无法做到的。因此公司文化的设计就比国家文化的设计更为明显。另外,衡量一家公司的业绩要比衡量一个国家的表现更为容易;而且公司的数量远多于其他社会单位的数量,从而更容易控制混杂的效应。与此同时,随着ESG概念在金融投资中的兴起,ESG中的两个支柱——“社会”和“公司治理”都和公司文化有关,这样金融领域的文化革命将会以更大的范围展现开来。
关于公司文化有几种不同的定义,Cremer(1993)认为文化是组织成员之间交流沟通的潜规则,一种与之相关的看法则把文化看作是促进协调的习俗,就好比在道路上右向行驶一样。作为管理学家,O’Reilly/Chatman(1996)则认为文化是“在整个组织中广泛共享和牢固持有的一套规范和价值观,这套共享的价值观(定义了何为重要之意)和规范定义了针对组织成员适当的态度和行为(如何感知和行动)”,在他们看来,文化的作用在于社会控制。就此而言,文化是对更传统控制系统——例如激励机制——的补充。后来经济学者普遍接受了O’Reilly/Chatman的定义,比如Guiso et al.(2008,2011,2015a)、Tabellini(2008)等。当然这种基于价值观的文化定义也更容易衡量,从而可以方便进行实证研究。不过学者们对基于价值观的解释也存在着不同的看法。Kreps(1990)就认为公司价值观仅仅是随时间推移发展起来的声誉,这样公司文化不会改变组织内个人的偏好,它只会在一个重复博弈中改变激励方式。但是Hodgson(1996)则认为公司文化会改变个人的偏好,并且会诱导在组织内部内化某些行为规范。最后,Weber et al.(1996)、Guiso et al.(2015a)、Graham et al.(2018)以及Grennan(2019)都认为,和持久而又深固的国家文化价值观不同,公司文化是路径依赖的,并且会通过重大公司事件来形成。
为了分析公司文化对经营活动和经营绩效的可能影响,我们需要厘清文化的重要性。在这方面,O’Reilly(1989)和Kreps(1990)都认为文化对于公司活动是有影响的,因为员工会面临从事前角度来看无法进行适当管制的选择。在Guiso et al.(2015a)看来,公司内部存在着双重的道德风险,首先是高管层面的道德风险,对于某些给公司带来价值的员工来说,公司高管可能会背弃要给他们奖励的承诺;[32]其次是员工层面的道德风险,如果员工给组织付出的努力无法得到有效衡量和奖励,那么他们就会想着出工不出力。在这方面,“信守承诺”的文化就可以减轻上述问题的影响。一方面,如果公司高管守信,那么这就会让守信成为公司的行为规范,由此促进公司员工在社会意义上遵守诚信的规范,从而减弱员工的道德风险问题;另一方面,因为明白背信这种行为会导致公司规范的崩溃,所以公司高管就不大可能用机会主义的方式来对待那些将自己的人力资本投入公司的老员工。通过这样的经济逻辑,我们就可以解释诚信正直的文化可以和优良的公司经营绩效有关。当然通过类似的逻辑,我们还可以说明其他的公司价值观,例如创新、尊重、团队精神等也会影响到公司的经营绩效。
可以用来量化公司文化的数据集是非常多样的,下面我们将介绍Guiso et al.(2015a)、Moniz(2019)、Green et al.(2019)和Li et al.(LMSY,2021)这四篇学术文章中涉及的四种分析公司文化的另类数据,并且讨论基于这些数据集针对公司绩效的含义。除了Green et al.(2019),其他文章本身并没有直接讨论基于这些数据集的投资策略和绩效。但是从这些文章的结论中可以看出,通过有效地度量公司价值观,我们可以区分出具有良性文化的公司和不良文化的公司。这样从多空组合投资策略出发,我们可以做多前者同时做空后者,从而获取相应的价差收益。
1.公司网站外宣的价值用词
对于上市公司来说,其网站上通常有专门介绍公司价值观、文化和工作环境内容的部分。通常公司会用一些词语来描述核心价值观,我们可以把这些词语称为价值词(value word)。而每个价值词还会通过其他关键词进一步来阐明和解释,以厘清某个特定词语的含义。这些关键词通常被称为种子词(seed words)。我们可以将针对某个价值词语形成的聚类看作是含义单位(unit of meaning),从而可以把公司用来描述特定价值观的所有关键词进行分组,形成不同的价值观维度。例如当公司用“诚实”“伦理”“责任心”等词语来描述“诚信”的价值观,那么所有这些词就可以归为一组。
Guiso et al.(2015a)收集了标普500指数成分公司网站上阐述公司价值观的信息,[33]由此就得到了公司用于外宣的价值用词(advertised values)。通过对这些宣传文档最常见词语应用关联分析,作者就对价值用词进行了分类,从而可以刻画不同维度的价值观。数据处理的具体流程是:
(1)确定所有公司中最常出现的价值用词,在这方面“诚信”出现的次数最多,有52%的公司会用它来刻画公司的价值观;
(2)针对每个公司分析与(1)步得到的价值用词聚类在一起的其他词语,然后计算这些词语在公司之间出现的频率,就“诚信”而言,与其最常关联的词语是“伦理”(ethnics),后者在34%的公司中与“诚信”有关,这样就可以把这两个价值用词归为一类;
(3)确定出现频率第二的价值用词,它是团队协作(teamwork),然后针对这个词重复进行上述第(2)步,由此确认与之最常关联的关键词,也就是合作(collaboration),这样就得到可以刻画第二个价值观维度的价值用词;
(4)针对最常出现的50个价值用词按照出现频率由高到低重复上述流程,然后根据公司网站上出现的词语关联关系把这些词语进行汇总。在这个过程中,如果某个经常出现的词语已经和出现频率更高的词语建立了关联关系,例如“责任”(accountability)这个词是排序第六的常见单词,但是与其最常关联的词是“诚信”,而“诚信”已经和“伦理”相关,那么我们就把“责任”这个新词加入到已经建立的分组中,也就是说涉及“诚信”的价值观现在包括了“诚信”、“伦理”和“责任”三个用词,这样
就扩大了用来描述相似概念的词语集合。
通过上述方式对所有公司网站最经常出现的50个价值用词进行汇总之后,Guiso et al.(2015a)就得到了标普500指数成分股公司网页上刻画价值观的九组词汇集合,如表1.15所示。在标普500指数公司中,有些公司网站的宣传资料并没有涉及上述任何一个价值观,而在大多数存在上述价值用词的公司中,只有一家公司只涉及一个价值观类别,剩下的公司大部分会涉及五个以上的价值观维度。图1.23描述了公司价值观维度数量的分布。
表1.15 上市公司网页外宣的价值用词分类
图1.23 标普500指数成分公司价值观维度数量的分布
资料来源:Guiso et al.(2015a)。
现在分析公司网站自我宣传的价值用词和公司经营绩效的关系。就此而言,Guiso et al.(2015a)首先给九个维度的价值用词赋予哑变量,也就是说,如果某家公司网站上出现了涉及某个价值观维度的价值用词,那么在这个维度上赋值为1;反之则对此赋值为0。为了度量公司的经营绩效,作者使用了如下四个指标:
(1)托宾Q(Tobin’s Q),它等于公司总资产减股东权益加权益市值后占总资产的比率;
(2)销售利润率(return on sale/ROS),它等于公司净利润和销售额之间的比率;
(3)消费者满意度指数(American Consumer Satisfaction Index/ACSI);[34]
(4)集体诉讼(Class action filed/CAF),它等于1995年以来针对公司发生的集体诉讼次数。[35]
上述指标可以从不同的角度度量公司的“成功”,而这些角度可能会被公司宣传的价值所影响。
表1.16报告了诚信价值哑变量对这些绩效指标进行回归的结果。从中可以看到,除了消费者满意度这个指标以外,无论是公司的利润率、托宾Q还是集体诉讼的频次,数据表明公司外宣价值和经营绩效之间没什么关系。而消费者满意度这个指标对于那些外宣诚信的公司而言显著较高。Guiso et al.(2015a)还报告了其他维度的价值用词哑变量和公司绩效的关系,结果和“诚信”得到的结果并没有定性的差异。就这个结论而言,一种合理的解释是公司在网站上对外宣传的价值观是为了给公司客户看的,由此就影响到了客户的满意度。但是公司的外宣价值与公司的经营绩效和股市估值之间则没有多少相关性,因为经营绩效和估值会受到其他很多变量的影响。另外一种可能性就是公司的外宣价值只是一种空谈(cheap talk)。对于公司来说,它们在网站上宣称遵循诚信原则的成本接近于0,这样不管公司内部实际存在的价值观是什么,大多数公司都会做这样的宣传。
表1.16 外宣的诚信价值和公司绩效
2.卓越职场研究所的调查
因为公司网站外宣的价值用词无法传递出真正的价值观所在,所以为了解决这个问题就需要寻找其他的另类数据源,由此Guiso et al.(2015a)就使用了卓越职场研究所(Great Place to Work®/GPTWI)的调查数据。[36]
为了评估公司文化,卓越职场研究所收集了两份调查问卷的数据,第一份是信任指数员工调查(Trust Index© Empolyee Survey/TIES)。这个调查衡量了员工对管理层的信任程度,它涉及58个问题,涵盖了员工对管理层、工作满意度、职场公平性以及同事情谊等方面的态度。第二份是文化评估调查(Cultural Audit© Survey/CAS),它一般由公司代表来填写,涉及公司薪酬和福利计划、公司实操以及其他方面的材料。
Guiso et al.(2015a)获得了2007—2011年间申请卓越职场的公司所作的调查数据,其中也包括那些没有进入到百家最佳职场榜单的公司。通过只保留公司在调查数据集中的首年数据,作者就构造了一个截面数据集,它涵盖了679家公司,其中294家是私人公司,剩下的385家是在纽约证券交易所或者纳斯达克上市的公司,其中有191家公司是标普500指数的成分股公司。表1.17给出了作者基于这两份问卷调查定义的重要变量。
在信任指数调查中,有关公司诚信文化的调查是围绕两个陈述性问题展开的。第一个是“管理层的行动与其言辞相符”,第二个是“管理层在业务实操中是诚实且合乎伦理的”。员工需要根据自己在公司工作的经验对上述两个问题打1~5的分数,其中1分表示相关陈述几乎不是事实,而5分则表示相关陈述几乎是事实。而在文化评估调查中,我们可以得到反映劳资关系和公司吸引力的几个变量:工会员工率表示加入工会的员工比率,工会员工申诉率表示每个工会员工申述的数量,岗位申请率则刻画了岗位申请数占当前员工的比率。在汇总了上述变量的截面数据之后,Guiso et al.(2015a)讨论了管理层诚信这个指标和公司绩效之间的关系,而对表1.12中其他几个刻画公司文化的维度则没有展开讨论。
在有关诚信问题的调查上可能存在着所谓的光环效应,从而会让所有的答案产生偏差。[37]例如在薪酬高的公司中,员工可能会感到更快乐,这个时候员工所有的回答可能就更加正面。为了解决这个问题,Guiso et al.(2015a)就使用针对其他问题的回应作为控制变量,这些回应尽管也存在着光环效应,但是在理论上和诚信问题无关。例如对表1.17中有关“安全场所”和“表现自我”问题的回应。
表1.17 基于卓越职场问卷调查的指标
表1.18报告了员工视角下的诚信价值和公司财务以及管理绩效之间的关系,其中涉及了财务绩效、劳资关系和职场吸引力三个方面的问题。表1.18A报告了以托宾Q(前四列)和销售利润率(后四列)为因变量的最小二乘回归结果。从第1列和第2列的数据来看,员工感知的管理层诚信和托宾Q之间存在着统计上显著的关系。如果使用“安全场所”问题反应作为控制变量,那么管理层诚信水平增加一个标准差将会让托宾Q增加0.23个标准差,而如果使用“表现自我”问题反应作为控制变量,那么托宾Q就可以增加0.47个标准差。[38]如果将管理层诚信问题替换为管理层伦理问题,那么第3列和第4列得到的结果是相似的,而且和前一个问题一样,当采用“表现自我”而非“安全场所”问题作为控制变量时,管理层伦理问题的反应对托宾Q影响更大。[39]第5~8列把因变量替换为销售利润率(ROS),我们可以再次看到公司绩效和诚信价值之间的正相关关系,只是在使用“表现自我”作为控制变量时回归系数才具有统计显著性。为了检测结论的稳健性,作者针对托宾Q还使用了其他的控制变量,包括资产收益率(ROA)、研发销售比、标普指数纳入等,结果表明基本的定性结论依然成立。
表1.18B讨论了公司诚信对劳资关系的影响。这里选取的两个因变量分别是工会员工率和工会员工申诉率,前者刻画了公司员工加入工会的比率,而后者则表示每个工会员工的申诉量。如果公司管理层的承诺时常不予兑现,那么员工就可能成立工会来寻求更多的保护。前4列的实证结果支持了这个解释:管理层的诚信水平和公司工会化程度负相关,同时如果使用“安全场所”作为控制变量,那么管理层诚信水平增加一个标准差,工会化程度就会减少0.07个标准差,而如果使用“表现自我”作为控制变量,那么工会化程度就会减少0.24个标准差。[40]当然只有使用“表现自我”作为控制变量时,回归系数才具有统计显著性。如果使用工会员工申诉率作为因变量,那么后四列的实证结果则表明管理层诚信水平和申诉数量没有显著的相关性,唯一的例外是使用管理层伦理来衡量诚信,同时使用“表现自我”作为控制变量,此时回归系数在5%水平上是显著的。
最后表1.18C部分报告了公司诚信对于职场吸引力的影响,就此也有两个因变量。第一个是大学生职业调查哑变量。如果某家样本公司在2011年进入优兴大学生职业调查(Universum Student Survey)排名前100的理想雇主,则设定哑变量等于1。[41]当采用这个职场合意性指标时,我们可以看到公司诚信水平和它具有正向关系,当然有一次在只有使用“表现自我”作为控制变量的时候回归系统具有统计显著性。第二个因变量是岗位申请率,以此来衡量公司不能满足的就业需求。这个时候职场吸引力和公司诚信水平之间的关系是模糊的。当使用“安全场所”作为控制变量时,公司诚信和公司伦理的回归系数都是负数,这和我们预设的方向是相反的,当然这个结论的统计显著性并没有明显。但是在使用“表现自我”作为控制变量时,公司诚信和伦理的回归系数就变为正数,而且在统计上是显著的。
表1.18 诚信和公司绩效
续表
总结表1.18的结果,我们可以看到,当使用卓越职场研究所的调查数据,用员工感知的公司管理层诚信和伦理水平刻画的文化价值更好时,公司就会产生更好的结果,这体现在更高的市场价值、更高的利润率、更好的劳资关系以及更强的职场吸引力。
3.社交媒体
Guiso et al.(2015a)采用外部调查数据来分析公司文化对公司行为和绩效的影响,但是这种方法存在着缺陷。因为调查需要人工完成,同时调查问卷中提出的问题以及调查所能覆盖的公司数量都是有限的。除了调查数据,我们还可以通过企业发布的公司社会责任(corporate social responsibility/CSR)报告来了解公司内部运行情况,进而评估企业无形资产的市场价值。但是这样的报告存在着和公司网站外宣材料相类似的问题,就是这些报告是企业自愿披露的:它们的出现可能是为了改善公司在社会公众的形象,而非改善公司信息的透明度;另外企业发布这些报告存在着内生性,也就是说企业可能只有在经营绩效不错或者预期不错的情况下才会发布。基于这样的考虑,Moniz(2019)就采用社交媒体Glassdoor上的数据来分析公司文化对企业经营绩效的影响。[42]大多数社交媒体的数据可以帮助从公司外部的利益相关方视角来分析公司行为,Glassdoor的特别之处在于它提供了公司员工表达对公司态度的社媒平台,这样就可以像卓越研究所做的调查那样,从内部的利益相关方视角来了解公司。当然相比于卓越研究所的调查数据只能覆盖有限的公司,Glassdoor的数据可以对一个大样本的公司集合展开分析。
为了将Glassdoor上的公司评论和金融证券数据库相匹配,首先就要解决实体匹配的问题。为此Moniz设计了一种算法,将Glassdoor评论中涉及的公司名称和CRSP数据库中的公司名称匹配起来。这种算法首先从公司网站和维基百科中获取公司的通用名称,然后使用这个名称列表在Glassdoor网站中搜索,由此检索出相关的评论。通过这种算法,Moniz总计得到了2237家美国公司从2008到2015年之间大约41万条评论。
接下来Moniz(2019)介绍了一种不同于Guiso et al.(2015a)的度量公司文化认知的技术,这就是Blei et al.(2003)提出的基于潜在狄利克雷分布(LDA)的主题建模方法。通过LDA的主题建模方法,Moniz针对Glassdoor的员工评论得到了六个主题聚类,如表1.19所示。现在每个聚类表示为语义相似概念的单词分布,表1.19针对每个聚类按照单词在文本中出现的频率,通过降序方式进行排列,由此帮助读者解释聚类的主题含义。
表1.19 主题模型得到的主题聚类
Moniz(2019)重点讨论了以绩效为导向的公司文化,因此就把分析局限于和最后一个主题“目标设定”相关的词语上,也就是分析员工对“规划”、“目标”和“绩效”等方面的讨论。就此作者就针对每一篇Glassdoor评论定义一个“目标”(GOAL)的指标,后者等于评论中出现“目标设定”主题的单词比例。为了分析员工评论所表达的情绪,Moniz给每篇评论计算了正面相对负面词汇的比率,并把这个比率定义为评论的“语调”(TONE)。为了确定词汇在情感方面的正负性,作者使用了一般问询者(General Inquirer/GI)的系统。[43]这个系统给每个词条(单词)非常全面的信息,包括词性、褒贬等。很多金融研究都采用了这个系统,例如Tetlock etal.(2008)针对《华尔街日报》专栏的内容分析。考虑到在社媒文本中频繁地使用口语,类似“虽然”“但是”“不”这样否定词会很常见,这样Moniz就采用了和常见“数词”(term counting)方法略微不同的策略:如果评论文本中在一个情感词周围五个单词出现了否定词,那么就改变这个情感词在GI系统的方向。
除了员工评论,Glassdoor还允许让员工从文化和价值观(Culture & Values/CULT)、工作-生活平衡(Work-Life Balance/WLB)、高层管理(Senior Management/SMGT)、薪酬和福利(Compensations & Benefits/COMP)、职业机会(Career Opportunities/OPPO)以及总体(OVERALL)等六个维度对公司给出从一星到五星的评级。
为了分析前述定义的“目标”具有独特的文化含义,Moniz还选择了两个和公司文化相关的指标进行分析。第一个是描述员工关系的指标。这个指标来源于KLD社会研究和分析数据库(KLD Social Research and Analytics Database)。[44]就某家公司而言,在特定年份中把员工关系指标中所有确定的优势相加,然后减去所有确定的劣势,由此就得到了员工净优势(net employee strengths),[45]Moniz把这个指标称为KLD。第二个指标和员工满意度有关,如果某家公司上榜《财富》杂志的“美国百家最佳职场”榜单,那么就设定“最佳职场”(Best Companies/BC)哑变量等于1,否则就等于0。此外,Moniz(2019)还使用CRSP(涉及价格信息)、COMPUSTAT(涉及会计信息)以及I/B/E/S(涉及分析师预测信息)这三个主流的金融数据库得到了用于控制变量的公司基本面指标,包括账面收益率(book-to-market ratio/BM)、公司规模(market equity/ME)、价格动量(price momentum/Pmom)、资产收益率(return on asset/ROA)、销售增长率(sales growth/SG)以及分析师更新(analyst revisions/AREV)。[46]这些控制变量旨在解决我们前面提到的光环效应,也就是当评论人使用公开可得信息来形成对公司的看法时可能产生的偏差。
Moniz(2019)做了两组回归分析Glassdoor评论的投资含义,表1.20报告了这些回归结果。表1.20A的第一组回归以托宾Q为因变量,其目的是为了验证“目标”这个可以刻画公司绩效导向文化的指标是否和托宾Q衡量的公司价值有关。第1列报告了托宾Q相对于“目标”、“语调”和“总体”五星评级的回归结果,其中使用了账面收益率、资产收益率、分析师更新和销售增长率作为控制变量;第2列的回归则使用了除“总体”以外其他五个基础维度的五星评级作为自变量;而最后1列的回归则增加了“员工净优势”和“最佳职场”这两个指标作为控制变量。[47]第1列的回归系数表明“目标”的回归系数为正,并且在统计上是高度显著的,这意味着绩效导向的公司往往具更强的获利能力。第2列表明各个基础维度的五星评级和公司价值之间并不存在统计关系。而第3列的回归系数则表明“目标”相对于员工关系(用KLD来衡量)和员工满意度(用BC来衡量)指标来说具有增量的信息含义。
接下来Moniz(2019)讨论了公司文化指标对于盈余预测的影响,表1.20B报告了回归结果。沿用Bernard/Thomas(1989)的方法,我们可针对每个公司计算未预期盈余(unexpected earnings/UEs)和标准化未预期盈余(standardized unexpected earnings/SUEs):
其中Et表示第t季度的盈余,而μUEt和σUEt表示公司在前20个季度未预期盈余的均值和标准差,它们可以用来刻画未预期盈余的趋势和波动率。[48]表1.20B中的回归以SUE为因变量,除了公司规模、账面收益率、分析师更新和价格动量这些控制变量,这组回归还加入了滞后盈余和分析师预测离散度两个控制变量。前者等于上一季度的SUE,而后者则等于盈余公告发布前最近期的分析盈余预测标准差除以盈余波动率。从表1.20B的第2列回归系数来看,“目标”这个自变量的回归系数为正,并且在统计上是高度显著的,这就表明这个指标包含有除了公司基本面或者“语调”之外预测未预期盈余的信息。第3列的回归控制了员工关系和满意度指标,结果表明“目标”中含有这些指标不能覆盖的信息。第二组回归的结果表明,通过LDA方法得到的公司“目标”指标和公司未来的未预期盈余之间存在着显著的统计关系,这说明公司文化对于财务分析明显是有用的。
表1.20 绩效导向的回归
续表
4.电话会议记录
公司文化和公司绩效之间的关系是一个很重要的话题。Graham et al.(2018)对公司高管做了一份调查,讨论影响企业文化最重要的因素,结果超过一半的人选择了公司首席执行官(CEO)作为最为重要的影响因素,其重要性超过了公司所有者、创始人、市场形象、内部政策和流程以及过去经历的艰辛这些选项。为了更好地度量公司文化,Biggerstaff et al.(2015)和Davidson et al.(2015)使用CEO的行为特征数据来刻画公司文化,而Guiso et al.(2015a)以及Graham et al.(2018,2019)则使用调查和访谈数据来研究公司文化。但是上述这些数据源都存在着样本公司有限的问题,Zingales(2015)和Graham et al.(2018)都谈到了这个问题。
前面Moniz(2019)使用的社媒数据可以覆盖更多的公司。由加拿大英属哥伦比亚大学金融系李凯教授牵头的一篇文章Li/Mai/Shen/Yan(LMSY,2021)则提出了另外一种数据源,这就是公司和分析师沟通时的财务电话会议记录数据。
Guiso et al.(2015a)以及Graham et al.(2021)都指出,公司文化的最重要因素是高管的诚信。当公司领导人尊重公司的价值观,并且做到以身作则,那么整个公司就会构建特定的价值观。基于这个想法,LMSY(2021)指出,如果公司高管能够言行一致,那么作为一种常用的外部沟通渠道,公司的电话会议记录就能够反映出公司的主流价值观。
在公司网站或者类似企业社会责任报告所发布的正式公告中,一套对外声明的价值观很可能只是用于对外宣传,从而出现“空谈”(cheap talk)的问题,我们在前面应用公司外宣的文本数据中已经看到这个问题。公司财务电话会议的主要目的不是让高管来讲述价值观,而是报告公司的业务经营和绩效情况。因此使用会议记录的文本数据就成为分析公司价值观较为“干净”的数据源。当然在电话会议中,公司高管也可能会粉饰自己的企业文化。不过Frankel et al(1999)、Matsumoto et al.(2011)和Lee(2016)都指出,公司电话会议除了包含财务信息,还会涉及和价值观有关的信息,这在很大程度上是电话会议的互动特性造成的。在公司电话会议记录中,涉及管理层陈述和展示的部分往往会事先得到公司法务部和投资者关系部的审查,所以这部分的文字存在着高管粉饰的可能。但是在即席问答(Q&A)的部分,因为公司高管几乎没有机会选择讨论的主题,而是需要即兴回答分析师和投资经理提出的问题,所以这个部分的数据就能够避免外宣价值观中存在的问题。这样电话会议记录中即席问答的文本就可以成为更“干净”的数据源。
为了更好地分析电话会议记录这种文本,LMSY应用了半监督学习(semisupervised learning)这种机器学习方法。具体来说,首先是沿用Guiso et al.(2015a)的分析,将标普500指数成分公司在网站上最经常提到的五个价值观设定为价值词(value words),包括创新、诚信、质量、尊重和团队合作,它们表达了公司的核心价值。接着通过词嵌入(word embedding)模型,具体来说就是Mikolov et al.(2013)介绍的词向量(word2vec)方法,训练一个神经网络模型来学习电话会议记录中所有词语和短语含义,这样就构造出一个“公司文化词典”,其中收录了与上述各种文化价值观密切相关的词汇和短语。例如,这种方法会自动将“联盟”“生态系统”“双赢”以及“肩并肩”这样的单词、短语甚至是习语识别为和“团队合作”这种公司价值观密切相关的术语。这样某家公司在团队合作上的分数就可以用电话会议记录中这些术语的频率加权和来衡量。为了更好地解决“空谈”问题,LMSY对在会议记录中更常出现的术语施以更低的权重,同时参照Larcker/Zakolyukina(2012)的方法,预先删掉那些充满情感描述的段落。
词向量模型是一种量化文本的方法。Loughran/McDonald(2016)就指出,当前大多数金融和财会领域的文本分析是在文档层级上进行的,其中会把单词看作是独立于前后顺序并且与上下文无关的符号。这种“词袋”(bag-ofwords)的想法是很多情绪(或者语调)分析背后的假设,正如我们前面看到的诸多文本分析的案例。[49]而词嵌入模型则通过神经网络深入解析单词的上下文,这样单词和词语就可以用向量而不是独立的符号来表示。这一方面可以对文本中的语义进行量化,而不仅仅是量化语法。另外,LMSY使用的算法还是一种介于有监督学习(supervised learning)和无监督学习(unsupervised learning)之间的算法。有监督学习需要通过人工方式对大量观测值打上标记,而无监督学习则不需要使用任何的人工输入。[50]与之相比,LMSY的方法并不依赖于对文档进行人工标记,但还是可以通过价值词和其种子词给算法提供有限但是关键的指导,从而可以让算法从电话会议记录中收集和公司文化有关的信息。
表1.21给出了和五种公司价值观最相关的词,其中的A组通过词向量之间相似度(用余弦公式得到)得到了五种价值观最具代表性的十个单词和短语;而B组则以词频-逆文频(TF-IDF)的方式计算得出在每种价值观中最为常见的是十个词。[51]
在生成文化词典之后,LMSY就给标普500指数成分股计算了从2001年到2018年在创新、诚信、质量、尊重和团队合作五个与公司价值观有关的得分。表1.22给出了从2013年到2018年得分最高和最低的五家公司。
在Graham et al.(2018)做的访谈中,公司高管把文化刻画为“信念系统”、“协调机制”和“看不见的手”。他们会认为公司文化会影响到企业运营的各个层面。这样LMSY就探讨通过上述方法刻画的公司文化在企业的运营效率、风险承担、盈余管理、高管薪酬设计等方面的作用。从先验的角度来看,很难说表1.21中描述的五种价值观更有利于企业的绩效。因为这五种价值观之间存在着较强的相关性。[52]这样LMSY就使用了一个总体指标来确认具有良性文化的公司,具体而言,就是如果一家公司的五种文化价值的总和在所有公司排序中位列前四分之一,那么这个总体指标就取值为1,否则就取值为0。表1.22报告了良性文化对于公司绩效的影响。
在表1.23中的回归分别以A~E组衡量公司表现的指标为因变量,然后以滞后1年、3年和5年的良性文化总体指标为自变量。A组的两个自变量,即资产周转率和存货周转率衡量公司的运营效率;B组的股票收益波动率(用月收益标准差来衡量)体现公司风险承担的行为。A组和B组的回归系数表明具有良性文化的公司往往具有更好的运营效率以及更强的风险承担能力。C组的因变量是操控性应计利润,它可以反映公司的盈余管理行为。[53]C组的回归系数表明良性文化的公司和盈余管理行为之间存在着负向关系,这意味着公司更加关注长期目标。D组的自变量反映了公司高管的薪酬设计,其中Delta表示CEO持有的公司股票和股票期权组合价值在公司股价变动1%时的变化值,Vega表示CEO持有的公司股票和股票期权组合价值相对于股票收益率标准差变动1%的变化值,[54]而CEO薪酬久期则是由CEO年薪的四个部分的加权平均久期得到的,这四个部分包括工资、奖金、限制性股票和股票期权。[55]D组回归系数都显著为正,这意味着当董事会遵循公司的价值观,那么高管薪酬的设计就将和价值观保持一致,而且将有助于高管承担风险和富有远见的行为。前面几组的回归表明公司良性文化有助于公司的经营,那么良性文化也应该导致更高的企业价值。就此而言,E组以托宾Q为因变量,结果表明良性文化与公司市场价值之间具有显著的正向关系,甚至是使用5年滞后的良性文化指标为自变量,这个正向关系也还是显著的。
表1.21 最具代表性和最常见的词
表1.22 高分公司和低分公司:2013—2018
表1.23 文化对公司绩效的影响
Graham et al.(2018)的调查中,公司高管认为当经济和经营环境变差时,公司文化和公司绩效之间的联系就更为明显。因为良性文化会促使高管和员工能够基于长远的利益共同努力,并且形成一致的决策。在这方面,从2020年初开始遍布全球的新冠疫情(COVID-19)就成为一个重要的分析场景。李凯教授牵头的另外一篇文章Li/Liu/Mai/Zhang(LLMZ,2021)则分析了这个问题。表1.24报告了以回报率为因变量同时以良性文化为自变量的面板回归结果,其中良性文化指标采用了LMSY(2021)的定义。回归的样本时段是新冠疫情爆发初期前后的时段,也就是从2020年1月2日到3月20日之间,同时股票收益率则是根据在这个时段上通过简单持有(buy-and-hold)的方式得出的收益率。
第一列回归是只包含这两个变量之间的回归,第二列回归加上了Fama/French(1993)的三因子模型以及Carhart(1997)的动量因子形成的四个因子载荷作为控制变量。这两列回归系数表明良性文化可以在危机期间产生很好的收益率。当然第一列和第二列回归中可能存在的一个问题就是导致拥有良性文化的公司在新冠疫情期间取得良好的股市业绩可能是和公司文化有关的变量,而不是公司文化本身。为了处理这个问题,LLMZ就引入了新冠危机之前公司的经营绩效以及会影响股票收益的重要公司特征,包括公司规模、杠杆率(资产负债比)、现金持有率(现金和可交易证券占总资产比率)、账面收益率、动量因子等。第三列报告了加入这些控制变量但是不包含四因子载荷的回归,而第四列则把四因子载荷也做控制变量纳入进来。加入这些控制变量后可以看出,具有良性文化的公司股市收益会减少一些,但是在经济和统计意义上看依然很重要。在控制变量最多的第4列中,具有良性文化的公司在2020年第一季度的收益率是3.93%。
表1.24 良性文化和新冠疫情时期的股票收益率
续表