二、研究设计

二、研究设计

1.变量定义与数据来源

(1)被解释变量

与前文一致,本章节从偿债能力和流动性两方面衡量国家外债风险,参考以往文献,具体从偿债能力和流动性角度选取外债占GDP的比例(Fordebt)、外债偿还额占出口比重(Debtserv)、政府所持有的国际储备资产与进口商品金额比值(Intliq)3个指标数据衡量政府债务风险。为使3个国家外债风险指标方向一致,使数据便于处理、比较和解释分析,数值参照ICRG的数据处理方法,将变量转化为得分,得分越高,国家外债风险越大;得分越低,国家外债风险越小;数值得分满分50分,最低0分。

(2)解释变量

语言分散化:为研究国家语言分散性程度,本文使用Taylor和Hudson(1972)构造的种族语言差异程度指标[190],Dow et al.(2016)在语言多样性研究中也使用此指标[105],其公式为:

图示

其中πi代表一国使用i语言的人口比例。本章节按语言谱系分类法将一国的语言按1语系—2语族—3语支—4亚语支—5语言—6方言6级划分,计算出6个不同深度的语言分散程度指标:Frac(1)~Frac(6),Frac(1)表示语系层级的分散程度指标,分裂程度最深;Frac(6)表示不同方言层级的分散程度指标,分裂程度最浅。在各层级上,语言分散化程度越高,Frac数值越大。

语言两极化:语言两极化程度指一国主要语言使用的人口比例接近程度,此比例越接近,语言两极化程度越高,两极化指标可以更好地衡量语言多样性引发的冲突程度。本章节使用Montalvo和Reynal-Querol(2005a,2005b)提出的两极化指标衡量,公式为:

图示

πi代表一国使用i语言的人口比例。与Frac相同,Pol也按语言谱系分类法计算出6个不同深度的语言两极化程度指标:Pol(1)~Pol(6),Pol(1)表示语系层级的两极化程度,分裂程度最深;Pol(6)表示方言层级的两极化程度,分裂程度最浅。对比Frac和Pol,当一国所有国民均使用不同语言时,Frac值取最大值1;而当一国只存在两种语言,且使用人口比例各占50%时,Pol值最大,语言两极化程度最高。

内部冲突:本章节使用ICRG中的内部冲突指标,分别从内战或政变的威胁、恐怖主义或政治暴力、民间动乱3方面实际情况和潜在影响,综合地衡量国家存在的内部冲突程度。

(3)控制变量

与上文一致,为研究语言多样性与国家外债风险的关系,并根据理论基础和数据的可得性,本章节基于现有研究分别控制国家经济因素和制度因素等控制变量,具体包括经济发展水平、经济增长率、通货膨胀率、失业率、法律与秩序、政府稳定性、官僚主义和民主责任。本章节使用变量详见表4.25。

表4.25 变量定义

图示(https://www.daowen.com)

(4)数据来源

国家语言多样性数据来源于Desmet et al.(2012)和国际语言中心(International Linguistics Center)提供的世界各国语言数据。结合“一带一路”沿线国家的实际情况,本专著按语言谱系将“一带一路”国家的语言按1语系—2语族—3语支—4亚语支—5语言—6方言6个层次进行分层,使用Frac和Pol两个公式分别在6个层次计算出6个语言分散程度和语言两极化程度。语言谱系分类,是根据语言的历史来源或语言的亲属关系对世界上的语言进行分类的方法,此方法把有亲属关系的语言归在一起,把没有历史同源关系的语言互相分开,通过此方法,可以更清晰和系统地掌握“一带一路”沿线国家的语言多样性情况,进而从不同层次探讨语言多样性对沿线国家外债风险的影响。本专著以“一带一路”沿线65个国家官方语言为例,具体列示了语言谱系分类表,由于国家方言种类繁多,故本章以官方语言为例,表4.26足以呈现出“一带一路”沿线国家的语言谱系分类的方法和各国官方语言之间的关系。

表4.26 “一带一路”沿线国家主要语言谱系分类

图示

续表

图示

续表

图示

注:资料来源Desmetetal.(2012)、王辉和王亚蓝(2016)[195]、国际语言中心数据,经作者整理。

国家外债风险指标数据和控制变量中反映国家经济因素指标数据均来源世界银行数据库和IMF数据库。控制变量中反映制度因素指标数据来自美国政治风险服务集团提供的ICRG数据,得分越高表示国家在该方面表现越好。

根据数据的充分性和可得性,本研究选取中国社会科学院发布的《“一带一路”沿线国家工业化发展报告》中包含的65个“一带一路”沿线国家,研究涵盖从2008年到2017年共计10年数据。剔除数据缺失的国家年份后,共计500个观测值。

2.检验模型设计

为了检验本章的研究假设4-3,语言多样性影响“一带一路”沿线国家外债风险,本章构建了如下回归模型:

图示

其中,Lang是表示语言多样性的主要测试变量。假设4-3a,当Lang代表语言两极化程度时,用Pol指标衡量,预期主要测试Pol的自变量系数显著为负。假设4-3b,当Lang是语言分散化程度,用Frac衡量,预期Frac系数显著为负。