4.1 数据来源与收集过程
中关村国家自主创新示范区(以下简称“中关村示范区”)起源于20世纪80年代初期在改革开放政策的鼓励下发展起来的中关村电子一条街。中关村示范区作为首个国家级自主创新示范区,其园区内部蓬勃发展的高新技术产业受到党中央和北京市委的不断扶持,已经成为中国创新发展的一面旗帜。从1994年4月起,经原国家科委(后更名为科技部)批准,中关村示范区进行了多次空间规模和布局的调整,从“一区三园”“一区五园”“一区七园”,逐步发展为“一区十园”和“一区十六园”的格局。之前已有研究证明了中关村示范区对于促进科技创新与区域发展的地位作用,然而这些研究忽视了对于中关村示范区内部的不同园区,如海淀园、丰台园、昌平园、朝阳园、西城园、大兴亦庄园、通州园、石景山园、东城园、门头沟园、房山园、顺义园、平谷园、怀柔园、密云园、延庆园等园区各自所处的地理位置不同,经历的历史沿革不同,园区内部的行业分布特点也不同。本书将通过细化分析,探究不同园区在促进其内部企业创新方面发挥的作用,填补已有文献在此方面的不足。
本书的样本为中关村示范区的企业2005—2015年间数据,园区内在本书周期内具有完整经营记录的全部企业都包含在内。经过初步的筛选和整理,其中有1 257家企业在本书所采用的变量维度上具有较为完整的信息,且在企业规模、所有制、行业类型等主要特征上与总样本的分布规律一致,因而成为本书的主要研究对象。研究样本包含各种所有制类型的企业,包括22.7%的国有企业和77.3%的非国有企业。同时,本书样本还包含了四种不同规模的企业类型,其中微型企业15.1%,小型企业55.2%,中型企业22.0%,大型企业7.6%,如表4.1所示。与其他抽样研究相比,本书的全样本数据可以避免选择性偏差,获得更详实、更准确、更有说服力的结果。
表4.1 样本企业基本情况统计
本书主要通过以下两个不同渠道获取关于中关村示范区企业在基本企业信息、人力资本、研发投入、专利申请与授权、新产品收入、财务状况等方面的数据。
(1)从中关村管理委员会获得了中关村示范区的企业2005—2015年间的年度统计报表,其中包含企业基本情况、人力资本、研发投入与产出状况等,本书通过这部分数据来衡量企业的知识生产效率与知识商业化效率。在对这些格式化的二手数据进行定量分析之前,本书在原始数据的基础上进行了大量的数据整合与清理工作。本书需要以2年为时滞,对每一家企业的知识生产效率(即研发投入与产出绩效)进行计算,以1年为时滞,对每一家企业的知识商业化效率(即新产品商业化效率)进行计算,因而从研发投入到经济产出的总过程为3年。本书以3年为一个总周期,筛选3年数据完整的企业,并将其录入到Excel和Matlab中,通过DEA模型进行效率计算。同时,本书将DEA模型的输出结果作为因变量,将企业和所处园区的其他相关信息作为自变量,录入Excel和统计分析软件Stata中,进行统计回归检验。
(2)从财政部所设国家中小企业发展基金旗下“天眼查”网站(https://www.tianyancha.com/)、企业网站公示、企业年报等渠道获取中关村示范区企业的技术并购信息。
(3)从中国产业技术创新战略联盟官方网站(http://www.citisa.org/)以及中关村国家自主创新示范区官方网站(http://zgcgw.beijing.gov.cn/)获取企业加入联盟信息。
(4)本书根据2005—2015年间中关村示范区内的企业列表,从北京市企业信用网(http://qyxy.baic.gov.cn)上通过企业名称逐条进行搜索,获得所有企业的所有制类型、登记状态、经营场所、股东变化等信息。本书将其与从企业年报中获取的数据进行对比和匹配,从而完整地反映企业的发展状况,同时也对数据的质量进行重复检验,增强数据的可靠性。本书将从“企业信用网”获得的企业经营场所的信息,与从中关村管理委员会处获得中关村示范区的企业2005—2015年间的年度统计报表进行复核比对,以明确企业所处的地理位置及经营场所随着年份更迭的迁移变化,并通过企业地理位置确定其所处的具体园区。此后,将文本信息(园区名称)转化为适用于定量分析的数据编码形式,并将其录入到Excel以及统计分析软件Stata中。通过这个过程,本书得以了解不同园区的企业分布特点与演化过程,从而更加准确地捕捉各个园区对于企业的影响作用。