1.5 主要问题及解决方案
(1)对风险投资家个人特征数据的收集和整理
已有文献中对人力资本特征的描述最多的是教育背景和工作经历,而本书的研究在前人研究的基础上,考虑了更多可能影响风险投资家投资绩效的变量,这些变量的数据均来自投中集团的CVSource(投中)数据库。CVSource数据库是中国VC行业最具权威性的风险投资数据库之一(另一个为清科数据库),国内大多数关于风险投资的研究都来源于此。
为了获取足够多的风险投资家信息,作者首先整理了所有具有管理团队的风险投资机构数据,然后整理了团队中每个风险投资家的个人简介,再从个人简介中手工提取其职业背景等个人特征。为了尽可能扩大样本规模,避免样本选择偏差,作者一共整理收集了1 845个风险投资机构的12 395位风险投资从业人员的个人简介,并从中提取了本书所涉及的3 741位风险投资家的个人特征。
除了本书所涉及的风险投资家的职业背景、政治背景和海外背景,出于未来研究需要,作者还整理了这些风险投资家的性别、年龄、受教育程度、科研经历、获奖经历、承担的社会职务等特征。另外,用于本书研究的个人控制变量也来源于对风险投资家个人简介的整理和统计,包括风险投资家以往的风险投资项目数、退出比例、投资行业比例等。由于很多数据存在缺失和信息不完整的情况,作者还尽可能地通过网络搜索的方式进行了核对和补充。
(2)对风险投资家投资绩效的衡量(https://www.daowen.com)
本书以被投资企业能否IPO衡量风险投资家的投资绩效。本书认为,能否通过IPO退出资本是衡量风险投资家是否成功的重要指标,帮助企业IPO是取得丰厚投资回报率的前提,也是风险投资对企业成长的最大贡献。研究过程涉及所有2001—2012年间接受VC的企业,本书认为,如果这些企业在2017年年底之前还不能公开上市,则不具备公开上市的能力,因为这说明企业从接受VC到上市的等待时间至少为5年,超过了样本中大约80%的上市企业从第一次接受VC到上市所需要的时间。
(3)解决处理效应(treatment effect)和选择效应(selection effect)
在针对风险投资研究的实证过程中,处理效应和选择效应始终是绕不开的问题。投资前后,风险投资家和被投资企业两个主体相互作用、相互选择。一个普遍的问题就是,如何判断前者对后者的影响是来自投资后前者对后者的实际作用,还是来自投资前双方的互相选择?这一问题反映到实证层面就属于自变量和因变量之间的内生性问题。考虑不同风险投资家、不同类型的投资时,这个问题就显得更加复杂。
在各部分的实证过程中,为了排除“自选择”和遗漏变量造成的内生性问题,本书的研究使用倾向得分匹配法(Propensity Score Matching,PSM)和工具变量法(Instrument Variable,IV)对样本和数据进行检验:通过倾向得分匹配法将不同背景的风险投资家投资的项目进行匹配,然后对匹配后的数据进行平衡性检验,在检验通过的基础上再进行样本的重新检验,将检验结果与原结果进行对比;工具变量部分用到了IVProbit模型,分别对初始样本和由PSM匹配后的样本进行检验,检验结果支持原有结论。