理论教育 数据来源与描述性统计:优化与应用

数据来源与描述性统计:优化与应用

时间:2023-07-06 理论教育 版权反馈
【摘要】:4.2.3.1数据来源与样本期选择由于分析师数据从2001年开始公布,“新财富”最佳分析师的评选始于2003年,而2006年会计准则的改革使得2006年前后的财务数据不具可比性,2008年的金融危机使得2008年、2009年的预测普遍存在极大的偏差,因此,以2010—2016年间的数据作为本次研究的样本区间。4.2.3.2描述性统计关键变量描述性统计如表4-2所示。表4-2关键变量描述性统计表4-3列示了主要变量的相关系数关系。

数据来源与描述性统计:优化与应用

4.2.3.1 数据来源与样本期选择

由于分析师数据从2001年开始公布,“新财富”最佳分析师的评选始于2003年,而2006年会计准则的改革使得2006年前后的财务数据不具可比性,2008年的金融危机使得2008年、2009年的预测普遍存在极大的偏差,因此,以2010—2016年间的数据作为本次研究的样本区间。但在计算证券分析师个股跟进经验时,以证券分析师2001年以来首次发布研究报告作为证券分析师职业生涯的起点,计算分析师在2010年时已跟进某一公司的时间,最终获得有效样本448 503个。研究中分析师盈余预测准确度(MAPE)、距离公告日的远近(FCAGE)、上市公司规模(log ASSET)、上市公司所处行业(INDUSTRYEFFECT)的数据来源于WIND数据库,其余变量数据均来自CSMAR数据库。为了消除异常值对实证研究结果的影响,对主要连续变量进行了1%的Winsorize缩尾处理。多点接触程度的计算采用SAS 9.4进行处理,其余数据处理与计量检验借助Stata 13.1完成。

4.2.3.2 描述性统计

关键变量描述性统计如表4-2所示。从证券分析师发布标新立异的观点的分布来看,证券分析师发表标新立异的观点的中位数为0,说明证券分析师并不倾向于发布标新立异的观点。从证券分析师的多点接触程度来看,各证券分析师所跟进股票间往往存在一定的交叉重叠,且分布并不存在明显的偏离(多点接触程度的平均值0.723 374与中位数0.775 170差异不大),中国证券分析师面临较高的竞争强度。由于同行业公司间的相似性,中国证券分析师往往不会只跟进一家公司,每位分析师平均跟进28家公司,甚至有分析师同时跟进193家公司。同时,分析师通常不会单独发布报告,往往会以团队台作的形式发布研究报告。

表4-2 关键变量描述性统计

(www.daowen.com)

表4-3列示了主要变量的相关系数关系。从各变量的相关系数来看,竞争激烈程度、绝对竞争优势地位和相对竞争优势地位间的相关系数均低于0.8,不存在明显的多重共线性问题,除Pearson与Spearman相关系数检验均显示分析师是否为明星分析师与分析师盈余预测准确度间不存在显著的相关关系外,竞争激烈程度、绝对竞争优势地位和相对竞争优势地位与分析师是否发表标新立异的观点、盈余预测准确度、信息领导地位间显著相关,从某种程度上说明分析师个体竞争特征对分析师个体行为特征具有重要影响,但其具体作用需要更进一步的实证检验。回归结果中主要变量的方差膨胀因子(VIF)均小于10,模型不存在严重的多重共线性问题。

表4-3 主要变量相关系数

(续表)

注:对角线上(下)方为Pearson(Spearman)相关系数。***、**和*分别表示在1%、5%和10%的水平上显著。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈