(一)计量模型
本文将采用事件史分析(event history analysis,EHA)模型检验上述假设。事件史分析又被称为生存分析(survival analysis),近几十年来在社会科学中已经得到了广泛运用[58]。该方法由贝瑞夫妇于1990年首次引入政策创新扩散研究领域[59]。事件史分析的目标是解释个体行为在特定时间点上发生的性质变化(即所谓的“事件”)。所谓事件史,是指在特定时期内,对某个体[60]是否经历某个事件的记录。在离散时间模型中,分析时段会被划分为不同的单位(例如年份)。在事件史分析方法中的一个重要概念是“风险集”(risk set),即样本中在特定时间可能发生“事件”(即拥有一个经历“事件”的机会)的个体集合。当被分析的“事件”是个体所不能重复的(例如死亡),那么在样本中的一部分个体经历“事件”后,风险集的规模就会降低。在离散时间模型中,被解释变量被称为“风险率”(hazard rate),通常被称为概率Pi,t,即个体i在特定时间t经历“事件”的概率。在这里,风险率被假定由一系列的自变量所决定。当然,风险率作为概率,无法被直接观察。因而事件史分析中的因变量是一个虚拟变量,在个体经历“事件”时取值为1,未经历“事件”时取值为0。这个变量的二分性质让logit模型成为优先采用的估测方法[61]。因此,上文中的假设可以被融合进以下离散时间事件史模型中:
其中pi,t是一个地方政府i在年份t决定建立市级行政审批中心的概率,pi,t/(1-pi,t)是优势(odds),log it(pi,t)是取对数后的优势(log odds),整个过程被称为“logit转换”(logit transformation)。公式中等号右边的变量除常数项β0外,其他变量涉及内部经济与行政因素、纵向与横向扩散效应,以及市委书记和市长的政治流动三个方面因素,将在下文变量设计部分具体阐述。
进而,尽管目前主流的创新扩散研究仍然使用离散时间事件史分析,即不控制时间因素,但是一些学者对事件史模型中不控制时间因素的做法表示了担忧[62]。因此,本文进一步将离散时间事件史分析模型的基础上引入时间控制变量。但是,由于在模型中加入过多的时间虚拟变量会牺牲自由度,并会导致基准风险率随年份变化的幅度过大,纳撒尼尔·贝克(Nathaniel Beck)、乔纳森·卡茨(Jonathan Katz)和理查德·塔克(Richard Tucker)建议,用三次样条变量(cubic splines)保证以基准风险率随时间过度的平滑性,是当前处理离散时段模型中时间依赖性的最好办法[63]。三次样条变量拟合的是一个变量在预定数量的时间间隔内的多项式。相对于许多个年份虚拟变量,通常几个样条变量就可以实现时间影响的平滑过渡,而且只会占用更少的自由度。根据这种办法,我们增加Duration和Spline两个变量。
其中Duration是指每次事件从开始到发生所需要的持续时间;Spline是由理查德·塔克开发的软件包btscs自动生成的三次样条变量。