银行个人信用评估方法研究

| 国内外信用评估状况比较

银行个人信用评估方法研究

目前,中国除了上海之外,其它城市还没有专营消费信贷调查业务的报告机构。1999年下半年,建设银行济南分行出台的《个人信用等级评定办法》在信用评估方面进行了尝试。该办法对不同的指标赋予不同的分值,对借款申请人的还款能力、信用状况等做出综合评价以决定贷款决策。随着信贷业务的需要,国内越来越多金融机构以业务对象的个人信用记录直接作决策参考,或附以一些评分方法,但毕竟以主观经验为主。而国外在信用评估方面已经有人做了大量的工作,提出了有FICO评分模型、神经网络模型、贝叶斯分析模型等等各种评估模型,并采用了各种数学的、统计学的、信息学的方法,取得了一定的效果,特别是FICO评分模型,更是成为西方发达国家信用评分事实上的标准。

二、常用评估方法

1.标准数理统计模型

基于标准数理统计理论的信用评分模型是对大量的个人消费贷款的历史信用数据进行科学的归纳、总结、计算而得到的量化分析公式。在美国,不同的行业有不同的信用评分模型来帮助专业人士进行信用风险管理,如表1所示:

表1 美国不同行业常用信用评分模型表

从概念上讲,信用评分就是利用消费者过去的信用表现来预测其未来的信用行为,如图1所示。

信用评分模型的关键是科学合理地选出信用变量,并产生一个公式。信用评分模型的统计方法有线性概率模型、logit模型、probit模型以及线性判别(Discriminant)分析方法。

(1)线性概率模型

线性概率模型假设违约概率Y与信用变量X之间的关系是线性的, 用于解释过去信用行为(违约或不违约)的信用变量及其重要性(系数)被用来预测未来的信用行为。线性概率模型数学表达如下:

根据历史样本数据进行优化计算,得出系数βj的估算值。

(2)Logit信用评分模型

Logit信用评分模型是采用数理统计的logit回归方法建模分析。logit信用评分模型的分析方法如下:

这里,Y∈{0,1}是二元响应变量,表示信贷状况;为logit概率累积分布函数。当Xj属于度量变量时,Xj表示为第j个可度量变量;当Xj属于范畴变量时,Xj表示为哑元变量向量。

(3)Probit信用评分模型

Probit 模型同样能够把违约概率的预测值限制在0和1之间。它与logit模型的不同在于probit模型假设违约概率服从累积正态分布(cumulative normal distribution),即

(4)线性判别模型

判别模型根据过去观察到的借贷者的信用特征,把他们划分成高违约风险和低违约风险类别。线性判别模型(Linear Discriminant Model) 假定信用变量对这种划分的影响是线性的。

2.数据挖掘技术

数据挖掘从大量数据中提取或“挖掘”知识,其任务可以分为描述和预测两类,用于信用评估,可对客户进行分类、聚类、关联规则发现、预测、偏差检测等。其中多数用分类、关联规则发现和预测方法进行个人信用评估。

(1)分类

按分析对象的属性、特征建立不同的组类描述事物。它基于对类标记已知的数据对象的分析,导出描述并区分数据类或概念的模型(或函数),用以预测类标记未知的对象类。导出模式可以用分类规则、判定树、数学公式或神经网络等形式表示。

(2)关联规则发现

某种事物发生时其他事物会发生的一种联系,这些规则展示属性-值频繁地在给定数据集中一起出现的条件,关联规则形式:X=>Y,即“A1∧...∧Am=>B1∧...∧Bm”。

(3)预测

把握分析对象发展的规律,对未来的趋势作出预见,其表示形式与分类同。

三、一种基于历史记录规则相似性的综合评估方法

由于国内银行业现有客户记录多数是不完整的,所以使用单一的方法进行评估未必能体现客户真实的信用历史状况。为了将数据挖掘技术和数理统计完全基于记录本身特征并与能够体现专家判断的评分很好地结合起来,本文提出一种基于关联规则的相似推荐方法,实现如下:

1.应用粗糙集理论对历史数据记录进行属性约简及规则提取

粗糙集理论是数据表简化和生成最小决策算法的有效方法,可以实现知识约简,发现属性表中的属性依赖,从而在信息不完全环境下进行知识发现,其定义如下:

S=<U,A,F,V>

其中,S:信息系统(决策表)

U:论域

A:属性集合

F:UXA→V的映射

V:属性值域集合

采用决策偏好信息的挖掘方法(参见文献[3]),对S进行属性约简并提取规则,形成不同支持度S和信任度C决策规则集合DN{ф→Ψ}(其中N代表提取的规则数量,可根据实际情况确定),且D是S不重复的子集,ф是条件属性,Ψ是决策属性,ф、Ψ∈A。

2.对测试记录与步骤1提取的规则进行相似性计算

相似性是某种关系强度的度量,可以通过数值比较来衡量(参见文献[4])。因为决策规则集合D不能完全覆盖所有测试记录属性值组合,而且决策表对象结构相同。测试集合SD中的任一组合(规则)Dd对照D中Dn进行相似性计算,得出SIM1、

其中, B:归一化因子

(B=1/ ∑Wi)

Wi:属性i贡献因子

(体现数据特性或专家经验,也可通过多种赋权综合评价求得)

SD(Dd,Dn):已知Dd发生,Dn也在同一组发生的概率

3.多赋权综合评价

对上述步骤求得参照各个规则的支持度S、信任度C及相似性SIM组成一个N个对象、3个指标的矩阵XN×3。

(1)运用变异系数法对X进行客观赋权

此时,第j个指标的权重就是 这种加权方法是为了突出各指标的相对变化幅度,即变异程度。

(2)对X使用线性插值法进行规范化处理,得到规范化矩形ZN×3,对其使用互补判断矩阵排序法求属性权重:

I=1运用综合赋权法将(1)、(2)两个权向量进行有机集成,得到综合权向量W=(W1,W2,......,WN)。传统的综合赋权有乘法合成归一化、线性加权组合法、基于spearman等级相关系数综合赋权法等,也可采用基于灰色关联度的客观权重综合集成法。

最终求出测试记录对各个规则的评价值fi=∑wj×zij ,(i=1,2,......,N),其中MAX(fi)就是与测试记录最相似的规则,可将其决策偏好作为测试记录的预期偏好。

四、结束语

基于历史记录规则相似性的综合评估方法以客观存在的记录规则为依据,更好地保留数据特征并结合专家经验,评估结果更加客观准确。