4.1.2 基于因子分析的科研评价指标体系构建

4.1.2 基于因子分析的科研评价指标体系构建

1.科研评价指标的选取

以国内各高校作为评价对象,目标是构建一个用于评价高校科研水平的指标评价体系。评价体系选取如下7个指标并按照前述三个维度进行分组:

All:各高校发表论文的总数量。该指标反映了高校科研的整体产出能力。

A12:各高校发表论文的总被引次数。该指标反映了高校科研成果的影响力。

A21:各高校发表论文的篇均被引次数。该指标反映了高校科研成果的质量。

A22:各高校发表的全部论文的被引率。该指标反映了高校科研的效率与科研成果的价值。

A31:被引次数排名前10%的论文百分比。

A32:ESI高被引论文百分比。

A33:ESI热门论文百分比。

A31、A32和A33这三个指标均代表了高校科研在研究前沿和热点的表现。

2.基于因子分析的指标分类

按照上面所述,需要将这7个指标进一步按照相关性的不同进行分类,以达到减少指标数目和简化分析的目标。为此引入因子分析的方法。

因子分析是利用降维的思想,将原始变量表示为少数“公共因子”的线性组合,原始变量在各个公共因子上的线性系数称为在该公共因子上的“载荷”,载荷的大小反映了变量与该公共因子的相关程度。根据变量在公共因子上的载荷大小将变量分到不同的公共因子上,从而形成若干组的变量,同组内的变量之间相关性较高,而不同组的变量之间相关性较低。因子分析就是找出公共因子,解释每个公共因子的意义,从而在各个公共因子下的变量也能代表性地反映该意义的信息。因子分析的方法在研究文献计量指标的相关性和独立性方面得到了广泛的应用。于是可以利用因子分析对科研评价的各个指标进行分类,这种分类方式的依据是指标数据之间的相关性,因此应该按照因子分析的结果对公共因子进行命名。

按照上面选择的7个二级指标,将中国39所“双一流”高校2005—2014年的指标数据作为样本进行分析,所有数据均从Web of Science提供的InCites数据库中下载,总共10年的累积数据能够保证获得可靠的结果和提供有意义的结论。

考虑有3个公共因子的情况,可以得到各因子的载荷矩阵如表4-1所示。

表4-1 7个指标在3个公共因子上的载荷

续表4-1

指标在各公共因子上的载荷反映了指标与该公共因子的相关性,载荷越大说明该指标与因子的相关性越强,从表中字体加粗的因子得分可以看到,指标All、A12在公共因子F2上载荷比较大,说明这两个指标与公共因子F2有很强的相关性,同时也说明这两个指标能够反映相类似的特征,可以分为同一类,进而分析出公共因子F2体现了一种“总量”的性质;同理通过观察其他在各公共因子的载荷可以看到,指标A21、A22可以划为一类,因子F3可以解释为反映“质量”的因子;指标A31、A32和A33也可以归为一类,因子F1可以认为代表了“前沿研究的水平”。

而7个指标的特殊方差估计psi为[0.012,0.018,0.005,0.141,0.079,0.005,0.854],可以看到除了最后一个指标A33外,其他6个指标的特殊方差估计均低于0.200,说明3个公共因子模型对原始数据的拟合效果是非常好的。另外3个公共因子对原始数据总方差的累积贡献率为85.4%,同样说明3个公共因子模型对原始数据有着较好的拟合效果。

3.科研评价指标体系的构建

按照因子分析的结果构建如表4-2所示科研评价指标体系。

表4-2 具有3个维度的科研评价指标体系

续表4-2

科研总量是高校科研规模的综合体现,取决于高校的学科规模、科研整体的产出以及辐射能力。科研规模的大小能够决定科研的效率高低,是一个高校承担重大科研项目或跨学科项目等的必要保证,也是向外扩大影响的重要途径,包含了发表论文的总数和发表的论文被引用的总次数这2个指标。

科研质量是科研绩效在学术水平上的补充,反映科研产出的质量与相对影响力,是科研成果在价值上的平均表现。它取决于科研成果在多大程度上能够得到同行的认可,是衡量科研绩效的重要指标,包含了篇均被引次数和论文被引百分比这2个指标。

前沿研究反映了一个高校在某一前沿领域的研究水平,同样也是学校科研活力和创新力的表现,包括被引次数排名前10%的论文百分比、ESI高被引论文百分比和ESI热门论文百分比这3个指标。