中国大学评价得分与ESI指标的统计检验
本研究的主要指标包括:中国大学评价得分Y,ESI学科指标X。其中,总被引频次为X1(千次)、发表论文数为X2(千篇)、高被引论文数为X3(篇)、热点论文数为X4(篇)、进入学科数为X5(个)。应用SPSS 25.0软件,分别计算原“985工程”高校的大学评价得分与ESI各项指标的相关系数,并进行显著性检验。相关系数取值与相关程度对应关系见表2-1。
表2-1 相关系数的取值与相关程度对照表

(一)ESI学科指标内涵的解释
(1)总被引频次。ESI学科排名的决定性指标,指某学科近十年发表的SCI/SSCI论文被ESI数据库收录期刊所引用的总次数,该指标集中反映了学科的影响力。
(2)发表论文数。指某学科近十年来发表的SCI/SSCI论文总数,反映某单位或学科对世界学术交流量的贡献,被ESI数据库收录的论文都是较高质量的论文。
(3)高被引论文。指某学科领域近十年来被引频次排在世界前1%的论文,反映了学科的扩展能力,该指标越大,表明该单位越有能力产出更多的优秀论文。
(4)热点论文。指某学科领域发表在最近两年且最近两个月被引频次排名位于世界前0.1%的论文,反映了学科的创新能力,是学科具有朝气的源动力。
(二)中国大学评价得分与ESI指标的相关分析
对37所原“985工程”高校在广研院、校友会、中评榜、上海软科等四个中国大学评价体系的综合得分与其ESI各项指标进行相关分析,结果见表2-2。相关分析结果表明:中国大学评价得分与ESI各项指标的皮尔逊相关系数基本都在0.7以上,为高度相关或极高相关,且在0.01的水平上显著。进一步的分析表明,中国大学评价得分与总被引频次X1、发表论文总数X2等两项指标的相关性最大,除了校友会评价体系,其他三个评价体系的皮尔逊相关系数基本在0.9以上,为极高相关;大学评价得分与高被引论文数X3、热点论文数X4两项指标的相关系数在0.8~0.9之间,为高度相关;大学评价得分与进入学科数X5的相关性相对较低,基本上呈中度相关。
表2-2 中国大学评价得分与ESI指标的相关分析

**表示在置信度(双测)为0.01时,相关性是显著的。
(三)中国大学评价得分与ESI指标的回归分析
既然中国大学评价得分指标与ESI各项评价指标之间存在显著的相关性,为了深入定量研究两者之间的关系,以中国大学评价得分指标为因变量Y,以ESI学科各项指标为自变量X,建立基于ESI学科指标的多元线性回归模型,选用向后逐步回归法,逐步剔除未通过T检验的自变量,同时检验回归方程的拟合优度、方程整体的显著性、自变量之间的多重共线性,最终得到的四个多元线性回归模型,如表2-3所示。
表2-3 基于ESI指标的中国大学评价多元线性回归模型

(续表)

注:***、**和*分别代表1%、5%和10%的水平上显著,括号内为标准误差。
由表2-3可知,进入ESI学科数指标X5在四个回归方程中均不显著,因而被剔除,最终回归方程中保留的自变量均在0.01的水平上显著。四个回归方程的拟合优度均在0.75以上,且回归方程整体线性关系显著。根据运行结果,可以列出四个回归方程:

由上式可见,并非所有的自变量均出现在最终的回归模型中,进入学科数X5在四个回归方程中均未出现。总被引频次X1、高被引论文数X3在第一个和第三个回归模型中不显著;发表论文数X2、高被引论文数X3在第二个回归模型中不显著;总被引频次X1、发表论文数X2和热点论文数X4等三个指标在第四个回归模型中均不显著。
(四)线性回归模型运行结果分析
(1)广研院大学评价模型。从模型I可见,广研院大学评价得分仅与发表论文总数X2、热点论文数X4两项指标有关。在控制其他变量稳定的条件下,发表论文总数每增加1000篇,大学评价得分平均增加1.67分;热点论文每新增1篇,大学评价得分平均增加1.072分。发表论文总数、热点论文数两项指标对广研院大学评价得分变异的解释度分别为70.3%和29.9%。可见,广研院大学评价体系侧重于论文的生产力,即论文数量的扩张。
(2)校友会大学评价模型。由模型II可见,校友会大学评价得分仅与总被引频次X1、热点论文数X4两项指标有关。在保持其他变量稳定的条件下,发表论文的总被引次数每增加1000次,大学评价得分平均增加0.02分;热点论文每新增1篇,大学评价得分平均增加0.37分。总被引频次、热点论文数两项指标对校友会大学评价得分变异的解释度分别为44.8%和47.7%。可见,校友会大学评价主要依赖于论文的影响力和创新力,且两者在该评价体系中的地位基本相当,校友会大学评价体系更偏重于论文质量的提升。
(3)中评榜大学评价模型。从模型III可知,与广研院大学评价模型类似,中评榜大学评价得分仅与发表论文数X2、热点论文数X4两项指标有关。在控制其他变量不变的条件下,发表论文总数每增加1000篇,大学评价得分平均增加0.66分;热点论文每新增1篇,大学评价得分平均增加0.345分。发表论文总数、热点论文数两项指标对中评榜大学评价得分变异的解释度分别为72.6%和25.1%。可见,中评榜大学评价体系与广研院大学评价体系类似,同样侧重于考评论文的生产力。
(4)软科大学评价模型。从模型Ⅳ可见,软科大学评价模型仅与高被引论文数X3一项指标有关。高被引论文数每新增1篇,大学评价得分平均增加0.04分。仅高被引论文数单项指标对大学评价得分差异的解释度就高达94.6%。软科评价体系侧重于论文的扩展力。
(五)研究的主要结论
(1)中国大学评价得分指标与ESI各项评价指标在0.01的水平上显著相关,因此,将ESI指标应用于中国大学评价存在合理性。纵向来看,中国大学评价指标与ESI的总被引频次、发表论文数等两项指标的相关性最大,其次为高被引论文数和热点论文数指标,最后为进入学科数指标。横向来看,总被引频次、发表论文数对四个大学排行榜的影响程度从强到弱依次为:广研院评价体系>中评榜评价体系>软科评价体系>校友会评价体系。由此可知,提高中国大学评价得分的最有效措施是提升高水平论文的发表数量和被引频次。
(2)基于ESI指标建立的中国大学评价多元回归模型整体线性显著。四个中国大学评价模型均通过了F检验,拟合优度在70%~90%左右,这意味着,模型可以解释因变量变异程度的70%~90%。从方程拟合优度值来看,广研院大学评价模型的拟合优度最高,达到90%以上,其次为软科大学评价模型,为89%,再次为中评榜大学评价模型,为87%,校友会大学评价模型拟合优度相对最低,仅为76%。从检验的F值大小来看,同样呈现上述规律。
(3)ESI各项评价指标在四个中国大学评价回归模型中显著程度有较大差异。其中,进入ESI学科数指标在四个回归模型中均不显著,表明某所高校的大学评价得分与该校进入ESI学科的数量基本无关。除此之外的四个ESI学科指标在四个不同的回归模型中显著程度表现不一,表明四个中国大学评价体系存在不同的评价理念。广研院和中评榜这两个大学评价体系均侧重考量论文的生产力和创新力,校友会大学评价体系则偏重于论文的影响力和创新力,软科大学评价体系更看重论文未来增长的潜力。如果某高校要提升自身大学排名,就要根据各个大学评价体系的特点,对症下药地采取针对性的措施。
(4)热点论文数指标对中国一流大学评价得分影响显著。37所原“985工程”高校发表的热点论文数合计为440篇,平均每校约为12篇。有14所高校的热点论文数在均值以上,有19所高校的热点论文数低于10篇。北京大学、清华大学的热点论文数最多,分别为46篇和42篇,两校合计88篇,占“985工程”高校论文总数的五分之一,第三名东南大学的论文数骤降至24篇。“世界一流大学B类”的西北农林科技大学、东北大学热点论文数仅为2篇和1篇。可见,热点论文数是体现一流大学水平的重要指标,对“双一流”建设意义重大。
(5)多元线性回归模型中变量系数的绝对值具有相对性。由于四个中国大学评价体系中大学评价得分取值的区间不同,广研院体系大学评价得分区间为[0,200],其他三个大学评价体系评价得分区间均为[0,100],因此,不可以对两个回归方程之间的系数进行比较。如广研院和中评榜大学评价模型中,发表论文数X2的系数分别为1.67和0.66,二者差值并无实际意义。换句话说,一个大学评价模型仅适用于自身评价,不适用于作横向对比。