1.4.2 研究方法
针对本书的主题以及研究对象科技园区企业的特性,将采用文献梳理、理论分析、数据包络分析模型、统计检验、实验建模等研究方法对1.3节中提出的研究问题进行系统和全面的分析。
文献梳理:针对研究涉及的主要概念——企业规模、企业创新效率等进行广泛的文献检索和阅读,对组织惯性理论、资源基础理论、企业技术并购理论、企业联盟理论、产业集群理论等与本书主题紧密相关的理论的主要内容、发展脉络、研究成果进行系统的梳理,为本书所提出的理论模型提供可靠的理论基础。
理论分析:结合对相关理论的综述以及已有的研究成果,从本书的研究问题出发,开展对科技园区企业效率影响机制的理论分析,提出与建立理论模型,同时提出相关研究假设。
数据包络分析(data envelopment analysis,DEA)模型:由于每一家企业的投入和产出都需要同时使用一系列指标进行衡量,因而在计算企业每年的知识生产效率和知识商业化效率时,本书采用了DEA-CCR模型来处理这种“多输入—多输出”的情况。这种模型不需要提前进行任何权重假设,而是以决策单元输入输出的实际数据来计算每一家企业的最优权重,消除了不少主观因素的影响,而且能够更加准确地描绘实际情况,在对于企业效率的评价方面具有优势。
统计检验:本书首先对2005—2015年期间中关村示范区的企业原始数据进行梳理与整合,将企业规模、地理位置、所处行业、创新投入和产出等相关因素进行提炼和编码,使其适用于定量分析。其次,本书将已有数据库中的相关企业信息与“企业信用网”等渠道的内容进行匹配与核对,同时获得关于企业所有制、技术并购活动、加入联盟类型等方面的信息,以丰富数据内容。最后,本书使用经过编码和匹配得到的数据,根据相关理论提出的假设设计非平衡面板数据回归模型,研究假设的显著性进行检验和分析。同时,对回归结果进行稳健性检验(robustness check),以便更加准确地验证企业规模与企业效率之间的关系及其调节因素,从而对理论模型进行进一步的修订,得出完整的研究结论。
实验建模:由于研究对象包含中关村示范区企业长达11年的各项指标,这些海量复杂数据为计算机模型的结构设计、参数选取和算法训练都提供了强有力的支持。因而,可以考虑使用与大数据和人工智能相关的研究方法,对已有数据进行更深一步的挖掘和分析。在本书中,选择神经网络模型,通过线性加权、函数映射等方式,对已有数据进行存储和学习,用优化学习算法实现对网络结构和权值的调整,最终使模型具有一定的逻辑推理和判断能力,以达到对未来企业发展提供创新效率预测和创新实践指导的目的。
结合拟定的研究主题与研究方法,本书的技术路线如图1.2所示。
图1.2 本书的技术路线图