Logit模型

四、Logit模型

(一)概念

出于对线性判别模型局限性的思考,越来越多的学者考虑构建Logit和Probit模型。Logit和Probit模型并不要求多元正态分布且协方差矩阵相等的假设。而且不必考虑财务数据呈非正态分布的问题,使得预测结果具有概率意义。

Logit模型可以表示为

图示

根据样本数据,通过迭代可以求出其最大似然估计值。概率模型也可以写作:P(事件i发生)=P(Y=j)=F(解释变量:参数);二元离散选择模型就可以写成:P(Y=1)=F(x,β)P(Y=0)=1-F(x,β),其中Y=1表示企业信用良好,Y=0表示企业信用风险大。

(二)模型设计

Logit模型通过标准化Logistic的累积分布函数的值,使其处于[0,1]区间。事件发生的条件概率为p(yi=1|xi)=pi,进行变换得到Logistic回归模型,即

图示

出于实际需要,可以把它转化为线性函数。不发生事件的条件概率为

图示

则事件发生与不发生的概率之比图示

将这个比称为“事件发生比”,简称odds。将odds取自然对数,得到:

图示(https://www.daowen.com)

logit(y),参数是线性的,值域为(-∞,+∞),且依赖于x的取值。

Logit模型就是对事件发生概率的判断,二元Logit模型可以有效地检验二元响应的因变量与一组解释变量之间的相关性,一般采用“极大似然估计”方法。

(三)应用

Martin(1977)首次用Logit模型和判别分析法预测银行破产概率,发现两种方法的判断能力非常相近。Ohlson(1980)也在较早的时候应用Logit模型进行了企业评估。Collins和Green(1982)在研究中表明了Logit回归模型在信用评价方面要优于Zeta模型。Smith和Laewrence(1995)选用Logit模型进行了建模,并得出预测贷款违约最理想的变量。West(2000)采用Logit模型研究了金融机构的违约概率。Jone和Hensher(2004)使用混合Logit模型后显著提高了模型预测企业信用风险的准确性。Figini(2009)选择多种方法对德国1003家中小企业信用进行分析,最终结果表明Logit回归模型的预测准确性要明显高于其他信用风险评估模型。Bartual等(2012)也认为Logit回归模型能够更好地预测企业的违约概率。

Samad(2012)建立Probit模型探究对美国商业银行信用风险造成影响的因素,发现Probit模型预测准确性也很高。Apergis和Payne(2013)也采用Probit模型分析了影响商业银行信用风险的因素。我国学者程建和朱晓明(2007)利用Probit模型模拟上市公司的违约情况,检验预测能力时进一步考虑样本依赖的问题,选择自抽样法随机抽取子样本对模型预测能力进行了检验。

(四)Logit模型的优势及不足

1.优势

①针对评估指标呈非正态分布且样本间协方差不相等情况,Logit模型表现出良好的预测效果。

②Logit回归模型不仅可以评估企业的违约概率,还可以用于企业信用评级。

③Logit回归模型操作便捷、评估精确,信用评级机构在评估时更偏向于使用Logit回归模型,如经典的Credit Metrics信用计量(摩根大通集团,1997)、Credit Model信用模型(标准普尔公司,1999)、RiskCalc风险计量(穆迪投资者服务公司,2000)。

2.不足

①由于Logit回归的决策面是线性的,处理非线性问题时容易出现过拟合的情况。

②高度依赖正确的数据,而且由于结果是离散的,只能预测分类结果。信息技术的进步降低了数据获取、管理和分析的成本,非参数模型开始引进企业信用的评估。人工神经网络(artificial neural networks,ANN)、支持向量机(support vector machine,SVM)、决策树(decision tree,DT)和遗传算法(genetic algorithm,GA)在信用风险评估中显示出比Logit模型更好的性能。