大公信用数据有限公司

行业动态

基于决策树的供应链金融企业信用风险评估模型简介

阅读:
发布时间:2018-03-27 17:12:50

  供应链金融作为全新的金融服务模式,有效解决了中小企业融资难的问题。因中小企业的信用评价存在特殊性,所以需要一套完整有效的评价方法来与之对应。本文运用决策树信用评价模型,示范构建了供应链金融中小企业信用评分表的方法,并分析了模型未来可扩展的空间。

  一、引言

  融资难一直是制约中小企业发展的主要瓶颈。我国中小企业由于自身信用基础差、财务信息透明度较低、法律法规体系不健全,很难得到银行的授信。而供应链金融模式最大的特点就是以供应链中的核心企业为出发点,一方面将资金有效注入处于相对弱势的上下游链属企业,另一方面将银行信用融入链属企业的购销行为,增强其商业信用,是中小企业融资模式的重大突破。

  对于供应链上中小企业信用风险的评价有如下几个特点:

  (一)突出“供应链金融模式”本身,即不局限于中小企业内部进行信用风险评定。该模式的核心是从整个供应链角度开展综合授信,所以更多的是要从供应链出发,分析贷款企业和核心企业的业务关系。

  (二)财务指标的不可考察性。我国中小企业大多未上市或挂牌,财务报表不同于核心企业,提供各种信息的可信度较差;尤其是企业财务报表,对工商、税务、海关、银行等部门提供的报表往往不一致,和真实情况差别较大。所以在信用风险测量中,应尽量弱化财务指标的影响,更多地去关注供应链业务和企业上下游的购销交易。

  (三)增加对中小企业管理层的研究分析。与核心企业相比,中小企业的管理人对企业经营和发展起着至关重要的作用,因此要更加注重中小企业经营者的道德、素质和社会声誉。

  中小企业不断增加的融资需求和供应链金融的业务模式对信用风险评估模型的修改和重构提出了更高层次的要求。下文将结合数据挖掘中的决策树技术,简要介绍基于决策树的供应链金融模式信用评估模型。

  二、决策树模型简介

  决策树模型是数据挖掘及数据分析中广泛采用的技术,其功能强大、易于理解,具有极高的人气。

  决策树模型的基本思想是将样本按一定的原则分割为若干子集,之后按照分割原则再次进行划分,直到某一层的全部节点都仅包括一类样本时终止,所形成的树状图形即为决策树。

  图1即为一个简单的决策树示例:在{水果}这一数据集中,“颜色”作为第一层次的区分属性,所有水果按颜色分为{绿,黄,红};之后依次在这三个子集中按“大小”、“形状”等作二次或三次划分,直到所有的叶节点只包括一种水果。将这些区分属性替换为供应链金融企业信用风险评估的各种指标,就能用决策树模型来辨识和区分供应链金融企业信用风险。具体步骤如下:

  (一)确定备选指标集。为了简化计算,本文选择核心企业短期偿债能力(核心企业状况)、交易频率(上下游合作情况)、

  应收账款周转率(供应链资产状况)和经营者从事管理年限长短(管理经验)四个指标来做模型示例(实际上选择的指标应当更多)。

  (二)按照每个备选指标将待研究数据分组,并用表格列示结果。本文模拟了500组数据(示例,非真实数据),按照第一步中的四个备选指标分组,形成四张表格。表1-1至表1-4显示了这一结果。例如,表1-1将500组数据按照核心企业短期偿债能力分为3类,其中“偿债能力强”这一类有271组数据。在这些数据中按照中国人民银行《关于全面推行贷款五级分类工作的通知》进行贷款分类,假定五类贷款分别为165组、90组、8组、5组、3组,以此类推。

  (三)计算每组分类的“信息增益”。这里的信息增益可以理解为“属性选择度量”或“分裂优良度度量”。我们在做指标选取和决策树分裂时,总是希望各组样本之间的差异性尽可能大,否则分类便失去了意义。因此我们引入“信息增益”变量来衡量样本子集的区分度。由于计算过程复杂,且涉及到信息论中“信息熵”的概念,理解起来较为困难。为节省篇幅,在此省略了公式的推导过程和计算过程,直接给出计算结果:

  Gain(核心企业状况)=0.0241

  Gain(上下游合作状况)=0.0182

  Gain(供应链资产状况)=0.0364

  Gain(管理经验)=0.0118。

  (四)将上一步算出的信息增益“投影”到0~100的区间内,以完成后续评估。我们最终要设计一张指标评分表,所以要根据信息增益衡量各个指标的相对权重。投影方法比较简单,例如

  w(核心企业状况)=0.0241÷(0.0241+0.0182+0.0364+ 0.0118)×100=26.67≈27。

  这表示核心企业状况在整个评分表中占27%的比重。

  类似地,我们可以计算出w(上下游合作状况)≈20,w(供应链资产状况)≈40,w(管理经验)≈13。

  (五)计算每个指标各类情况下的信用风险度量值,并投影到该指标的计分区间内。信用风险度量值的计算逻辑是分别用每类贷款的风险系数乘以该类贷款客户数,求和之后再除以总客户数。其中,风险系数需要进行经验性估计,也可以利用国内学者的研究成果,例如(0,0.05,0.4,0.675,0.875)。

  我们仍以核心企业短期偿债能力为例。

  核心企业短期偿债能力=“强”时,信用风险度量值为(165×0+90×0.05+8×0.4+5×0.675+3×0.875)÷271=0.0506,同理可得核心企业短期偿债能力=“中”和“差”时的信用风险度量值为0.0570和0.1250。已知核心企业状况在整个评分表中占比27%,那么我们可以给核心企业短期偿债能力=“强”的待评企业27分,=“中”的待评企业可以得到27×0.0506÷0.057≈24分,而=“差”的待评企业只能得到27×0.0506÷0.125≈11分。

  以此类推,我们就可以设计出一张信用评分表(见表2)。

  三、总结和展望

  本文对基于决策树的供应链金融企业信用风险评估模型进行了简要的介绍。事实上该模型仍然具有可以充分讨论和扩展研究的部分,例如:利用决策树进行信用风险预测,通过预测准确性来修正算法(此时信息增益将不再作为唯一判定区分度的指标)和树形(通常情况下决策树分枝较为复杂,为计算带来麻烦;通过剪枝可以减少决策树预测错误的概率)。多数技术需要编写程序并反复测试程序运行结果,手续繁琐,且需要极为丰富的高等数学和计量经济学的知识储备。由于篇幅限制,本文暂不对其进行介绍,可以留待后续再进行深入研究和探讨。(文/王彦龙)