创新,发展之源
当今的科研工作重点在于创新,尤其是发表论文的时候,评审团最看重的事情之一是你的论文是否在某一领域有所创新;创作论文的人,也在努力地通过研究,在某一领域获得创新性的突破。创新是社会发展进步的源泉,我们格外关心创新。
创新是怎么定义的?创新,顾名思义,创造新的事物,创造新的事物分为两层含义,一层是开创了前所未有的事物,第二层表达的是“更新”的含义,即本来存在着一个事物,用另外一个新事物来替代它。我们这里提到的创新更偏向于创新的第二层含义。也由此,我们想到一种形象的方式定义创新,创新其实是一个新的事物挡住了旧事物,向日食一样,月亮遮住了太阳,后来的人,只能看到新事物,不能看到旧事物。
“创新”实际上是一个非常模糊的概念,如何测量创新?把“创新”这个模糊的概念通过数据量化,我们想到了一种量化的方法。现在很多中国科学家喜欢测量,但是测量出来的东西表达出什么现象,要进一步思考的时候,就退缩了,这样我们中国科技很可能会被印度人打败。言归正传,一种创新的想法通常是站在前人的肩膀上往前走了一步,这个“肩膀”可能是巨人的肩膀,也可能不是,很少有人的想法是凭空而来的,我们大部分人的想法都是建立在别人的想法之上的。一些想法的“肩膀”是有迹可循的,而一些则很难找到源头,刚好在科研论文方面,都能找到支撑这篇科技论文的“肩膀”。
当然,一篇论文的参考文献数量较多,其中有很多参考文献和论文没有直接关系。实际上真正的论文规范要求当有一些人的想法启迪了你,你应该引用这个想法。现在你论文完成了,恭喜你,之后论文也成功发表了。那么就会有人引用你的文章,评副教授、教授职称时引用量是作为一个评价指标的,通常学者们会关注引用量,但是我们关注重点不在引用量,而是引用结构。图5-4中较大的盘子表示引用你的论文,我们把论文的引用结构划分为三种,分别用如图:5-4中绿、红、蓝色方框表示。第一种结构为绿色方框,表明引用者既引用你的论文i也引用了你的参考文献j;第二种引用结构是红色方框,引用者只引用了你的论文i;第三种结构是蓝色方框,引用者只引用了你的参考文献j。我们认为,红色与绿色出现的概率之差,就是量化后的“创新性”,该值越接近于1,论文创新程度越高。单单从引用的绝对数量出发考虑创新性,其实是不够合理的,准确的来说,它只能说明你的文章有多流行,而使用引用结构却能够挖掘出你文章中更深的含义。

图5-4 测量颠覆性创新的公式
虽然定义了创新,但单单告诉你,你做的事情有60%是创新的,这样一个数值似乎显得很苍白,社会学是面向大众的学科,需要找到一种通俗易懂的表现形式展现,另外,我们不能只告诉你一个创新指标的值,还需要尽可能多的将创新指标的值内部的信息与其他影响创新的因素相结合,我们还想让你知道你和别人有什么不同。最终,我们选择了树来向你更形象生动的传递我们的想法,事实上,我们画出来的黑白颜色的树更像是秋天已枯黄的芦苇,我们给它起了一个形象的名字“引用树”。树的枝叶高度表示引用该论文的时间,枝叶形状表示不同的引用结构,如果是绿色方框表示的第一种结构,论文既引用了你的论文也引用了参考文献,则枝叶曲线向下垂,如果只引用了你的论文,也就是红色方框表示的第二种结构,则枝叶曲线向上翻。树的根部越长,说明引用参考文献越老,根部的形状同样也展示了你论文的引用结构。
我们根据创新指标值(Disruption),将三篇影响力相似的论文以“引用树”的形式表现出来,说明创新指标是如何区分不同科技贡献的。图5-5中的A树,引用量是3433,是Bak,Tang和Wiesenfeld于1987年提出沙堆模型的论文,这篇论文首次提出了“自组织”的概念,可以说是开创型的论文,B树是一篇验证型的论文,1995年发表,有3269篇论文引用,这篇文章非常好,是维曼因在碱性原子稀薄气体中验证了玻色爱因斯坦凝聚态的论文,由此维曼因获得了诺贝尔物理学奖,但是引用这篇文章的论文,通常也会引用该论文的参考文献,因为它是一个验证型的论文,所以该论文的创新指标值不高,创新指标值不高是不是意味着否认物理等验证型学科对社会发展的贡献,当然不是的,不同学科之间的引用结构是不同的,我们在比较不同的论文时,需要控制了论文的类型,区分实证论文与理论验证论文两种类型,这里为了介绍不同结构的论文,我将这三张图放在了一起。如果要更加合理的比较论文的创新性的高低,除了要控制论文的类型,还需要控制比较的对象引用量是相近的,或者说控制文章发表的时间,50年代的文章与90年代的文章引用量显然是不同的。C树是一篇关于宇宙学的文章,发表于1999年,这篇论文的引用量最高。如果枝叶向上翘起的越高,这样翘起的枝叶越多,论文的创新性越高,可以看出A与C的论文创新度更高。B图更多的是发展性,而非颠覆性的创新工作。

图5-5 三种不同结构的论文“引用树”
图注 量化创新程度。a,创新的简化说明。引文网络包括焦点论文(橙色菱形),参考文献(灰色圆圈)和后续论文(矩形)。后续论文可能仅引用焦点论文(i,绿色),仅引用参考文献(k,黑色),或引用焦点论文和参考论文(j,棕色)。焦点论文的创新程度由b中的等式定义,若公式值为0,论文则兼顾了创新和发展(创新=0),若公式值为-1,焦点论文意义主要在于广播参考论文工作的重要性(创新=-1),若公式值为1,焦点论文的工作完全取代或颠覆了参考文献中的研究工作(创新=1)。c,引用树可视化,显示焦点论文的创新程度,焦点论文吸收参考文献的工作并提出自己的想法传播给后续引用它的论文,引用树的“根”是对参考文献和后续论文描述,其深度表示参考文献的发表日期,越深参考文献越“老”;“分支”是对引用焦点文献的后续论文的描述,高度越高,后续论文越“新”,“分支”越长,后续论文的数量越多。如果后续论文也引用焦点的参考文献,则分支向下弯曲(棕色),否则分支向上弯(绿色)。三个影响力相同的文章的引用树展示了如何用创新区分一篇论文对科学和技术的不同贡献,包括Randall和Sundrum的“A Large Mass Hierarchy from a Small Extra Dimension”,由Davis等人提出“Bose-Einstein Condensation in a Gas of Sodium Atoms”,由Bak等人提出的“Self-organized criticality: An explanation of the 1/f noise”。