9.1.2 数据来源与数据标签

9.1.2 数据来源与数据标签

本书的数据样本包含了中关村示范区内超过1 257家企业2005—2015年期间的非平衡的面板数据,这有助于本书把握科技园区内企业的整体特征,这11年的纵向数据可以帮助本书捕捉到每一家企业随着时间发展和变化的轨迹。

由于不同的行业都有其衡量企业规模的标准,因此在列表中的所有企业规模被分为大、中、小、微四种类型,微型企业取值为1,小型企业取值为2,中型企业取值为3,大型企业取值为4。具体划分标准参照工业和信息化部、发展和改革委员会、财政部讨论制定并于2011年出台的《中小企业划型标准规定》和国家统计局印发制定的《统计上大中小微型企业划分办法》,将企业的员工数、年收入、总资产等指标作为企业规模划分的标准,同时考虑到了不同行业的特点。

企业技术并购、企业所处园区类型、企业加入的联盟类型、企业所属行业(服务业、制造业、邮电业、零售业等多个不同的行业大类)、企业年龄、政府资金支持、企业的所有制类型等也包含在数据集中。同时,基于DEA模型,对所有企业的知识生产效率、知识商业化效率和综合效率进行计算,为了保证数据的平衡性,三种效率的阈值都是中位数。根据相应的阈值,将这三种效率划分为1和0两种等级,用作分类问题的标签。三个标签分别对应三个分类问题:企业知识生产效率的高低、知识商业化效率的高低以及综合效率的高低。处理过的标签如图9.1所示。

图9.1 三种效率分类结果