信用舆情指数的构建
(一)信用舆情分类指数权重的确定
为了得到舆情指数,还需要确定基础信用值与各分项舆情值的权重。在确定基础信用值和分项舆情值的时候,本研究采用搜索指数的热度作为确权的依据,但在合成总指数和各大类指数(维度指数和领域指数)时,仅用热度确权并不合适,这是因为检索关键词数量有多有少,检索关键词越多,该维度或领域的搜索指数权重就会越高,因此增加检索关键词就会增加权重,而事实上关键词是无法穷尽的。为了克服检索词太多造成的权重失衡现象,需要采用其他确权方式在维度和领域之间进行权重平衡。因此,本研究采用“搜索热度+波动性”的方式来综合确权,因为波动性可以及时发现舆情信号,数据序列的波动性越强,舆情发生越频繁,权重就越高。分类指数权重结果如表6-4所示。
表6-4 各分类指数权重计算

(二)信用舆情总指数的构建与修正
总指数通过基础信用值和各分项舆情值的线性加权得出,其取值范围为[0,100],指数值越大,表明舆情热度越高。为使总指数更客观地反映信用舆情的长期变化趋势,有必要对指数值做进一步的修正。由于基于关键词搜索指数的舆情值会不可避免地受到互联网用户基数的影响,为了将这种由用户基数增长带来的舆情变化因素剔除,本研究考虑用互联网普及率的发展速度来做修正。由于样本期内我国互联网普及率增速均大于100%,因此修正后的历年指数值将有不同程度的降低,具体结果见表6-5。
表6-5 信用舆情总指数
(https://www.daowen.com)
注:历年互联网普及率来源于《中国统计年鉴》。
(三)维度和领域信用舆情指数的构建
信用法治舆情、政府公信舆情、信用热点舆情、社会诚信舆情四大维度的信用舆情指数由相应维度的分项舆情值通过线性加权方式得到,政务领域、商务领域、社会领域、司法领域信用舆情指数由相应领域的分项舆情值通过线性加权方式得到。这两个舆情分类指数同样用互联网普及率增速进行修正,结果分别见表6-6和表6-7。
表6-6 不同维度的信用舆情指数(修正后)

表6-7 不同领域的信用舆情指数(修正后)
