信用评级论文

2023-02-12 17:35 481 浏览

关键词: 信用评级;Python语言;主成分分析;多元Logit模型

摘要: 首先用Python语言对123家小微企业共约三十七万条交易信息进行分类整理;然后用主成分分析将多种信息归为四类主要因子,并引入定性变量;最后建立多元Logit模型对企业进行由好至差的A、B、C、D四类评级。结果显示:整体评级准确率达到72%;交易信息离评级时点越近,评级的准确率越高;该模型对D级的评级准确率达到100%,说明该方法能有效甄别最差级别企业,为商业银行规避不良贷款发生提供了一种可行性方法。

1. 引言


小微企业是一国经济发展的基础性力量,它们不仅提供大量就业岗位,而且为经济注入活力,在保持社会稳定方面发挥着巨大作用。特别,美、日等发达国家的经验表明,许多今天的巨型企业都是由当初的小微企业发展起来的。但是小微企业由于成立时间短、几无固定抵押资产、缺少资信等特点,在小微企业的成长过程中一直存在融资难问题。近年来,国家出台了一系列扶持小微企业发展的金融政策,引导商业银行等金融机构为小微企业提供融资支持小微企业发展。金融机构一方面要承担起为小微企业融资,支持小微企业发展的社会责任,但另一方面,又要尽可能的减少小微企业的违约风险,以规避金融系统的借贷风险。因此,如何根据能获得的小微企业信息,给企业进行评级,进而针对不同信用级别的企业制定合理的贷款额度和贷款利息是商业银行十分关注的重要问题。


企业信用等级作为商业银行风险管理中重要的组成部分,为信贷决策提供了重要的依据。关于如何对企业进行信用评级以及哪些因素可能会引起企业违约风险,此前已有大量研究。在传统分类模型方面,Altman等(2013) [1] 认为从统计学的角度考虑,Logit模型回归似乎更适合于解决违约预测的问题,在因变量是二进制(是/非)的条件下,组别都是离散的、非重叠的和可识别的;孙雨忱(2021) [2] 通过构建二元Logistic回归的违约率测算模型,测算出不同信用水平下中小微企业的预期违约率;高璐冰等(2021) [3] 使用熵权TOPSIS法计算每个企业的得分,量化信贷风险并确定信用评级,建立二元Logit回归模型确定企业违约概率。在机器学习模型方面,乔薇(2011) [4] 选取了流动资产周转率、净资产收益率等指标建立了AHP模型对中小企业进行多级模糊综合评级;徐晓萍和马文杰(2011) [5] 运用判别分析法和决策树模型,对非上市中小企业的违约风险进行了分析,发现二者结合能较好地判断企业违约率;郭妍等(2013) [6] 建立二元Logit回归模型和LDA模型对我国中小企业信贷风险进行实证度量,对企业是否违约进行预测;夏利宇等(2019) [7] 将XGBoost算法与Logistic Group Lasso模型相结合建立了企业是否违约二分类模型,评估了客户违约风险;白羽等(2021) [8] 通过建立神经网络模型预测企业未违约率,量化分析了企业信贷风险。


综上,目前的研究主要方向是用二元Logit模型和其它包括机器学习方法对企业是否违约的二分类情形进行预测研究。但银行要发放贷款,并且要实施有差异的贷款利率,就需要获得准确的企业信用等级,以按不同等级发放贷款额度和确定贷款利率。目前,对企业进行等级评价这方面的研究较少,特别对几无固定资产、无担保的小微企业的信用评级研究还未见有。如何针对小微企业所提供的有限信息,通过数据处理获取相关特征,对企业进行等级评定,进而为商业银行制定贷款策略提供依据,正是本文研究的主题。


本文研究这样一类小微企业:它们无固定资产,也无信誉担保,在向银行提出贷款时,唯一能提供的真实信息是它们一段时间的大量的“进、销项”财务记录。本文首先用Python语言对初始数据进行处理、分类,提取有用信息;然后利用因子分析法对大量、多维信息进行降维;最后,建立多元多分类Logit模型对企业进行信用评级(按A、B、C、D四类评级),为商业银行更加客观、准确地评估小微企业的信用状况,制定合理贷款额度及贷款利率提供有效参考。


2. 数据处理及变量选取


数据来源于某银行获得的123家有信贷记录且已有评级的小微企业的相关经营信息1,包括:企业进项和销项发票信息、企业类型、企业信用评级等数据,其中进项发票数据共210,948条,销项发票数据总共162,485条。时间2017年1月至2020年2月。


2.1. 数据预处理


首先,运用Python语言对123家经营信息共约38万条原始发票数据进行整合处理2。发票所含直接信息为:企业名称、企业信誉评级、企业是否违约、进项发票金额及税额、销项发票金额及税额、进/销项作废发表、发票号码、开票日期、购/销方单位代号等。引入“有效收入”,“作废发票率”及“负数发票率”定义如下:

image.png

经Python语言处理将发票信息归结为以下几个方面:1) 总发票、有效发票、负数发票和作废发票的数量;2) 有效金额,有效税额,有效价税总和以及作废额;3) 进项和销项发票总数;4) 有效收入、作废发票率、负数发票率等。


2.2. 主成分因子提取


由预处理共计获得19个变量,它们是x1:进项发票数量、x2:进项有效发票数量、x3:进项作废发票数量、x4:进项负数发票数量、x5:进项有效金额、x6:进项有效税额、x7:进项无效额、x8:进项有效价税总和、x9:销项发票数量、x10:销项有效发票数量、x11:销项作废发票数量、x12:销项负数发票数量、x13:销项有效金额、x14:销项有效税额、x15:销项无效额、x16:销项有效价税总和、x17:有效收入、x18:作废发票率、x19:负数发票率。由于变量过多,且一些变量可能存在较强的相关性,不能直接用于评级分析,故进行变量整合,拟采用因子分析法对预处理得到的特征变量进行降维。因子分析使用统计软件SPSS 24。


首先考察原有变量是否适合进行因子分析,利用KMO指标和巴特利特检验进行。KMO指标主要作用是观测相关系数值和偏相关系数值,巴特利特检验用于检验各变量是否独立。KMO和巴特利特检验结果如表1所示。

image.png

表1. KMO和巴特利特检验


由表1可得,KMO = 0.681,根据专家给出的标准,KMO > 0.5,说明所选取的原始变量之间存在强相关性。巴特利特球度检验原假设为相关系数矩阵是一个单位阵,变量无相关性,由结果得显著性为0.000,所以该相关阵各变量之间存在相关性,说明可以做因子分析。


因子提取方法选用主成分分析法,首先计算各因子的特征根,结果显示:特征根 > 1的因子总共4个,且该4个因子已经可以包含原始变量86.225%的信息,所以提取4个公因子。提取的四个主成分因子如下:


第一主成分因子(F1)在指标进项有效金额、进项有效税额、进项无效额、进项有效价税总和、销项有效金额、销项有效税额、销项有效价税总和有较大载荷,这些指标主要反映了这些企业的有效资金情况,所以定义第一主成分因子为“金额因子”;第二主成分因子(F2)在指标进项发票数量、进项有效发票数量、进项作废发票数量、销项作废发票数量有较大载荷,这些指标主要是反映了这些小微企业的各项发票数量,故定义第二主成分因子为“活力因子”;第三主成分因子(F3)在指标销项负数发票数量、负数发票率有较大载荷,这些指标主要是反映了企业入账记税后购方因故发生退货并退款的情况,故定义第三主成分因子为“故障因子”;第四主成分因子(F4)在指标有效收入有较大载荷,主要是反映了这些小微企业收入情况,定义第四主成分因子为“收入因子”3。


通过因子分析对指标降维后,最终确定了上述4个评价指标,分别是F1:金额因子,F2:活力因子,F3:故障因子,F4:收入因子。将分析这些变量对企业评级产生的影响。


2.3. 其它变量确定


为保证研究小微企业评级问题的全面性,除前述经因子分析获得的4个主成分因子变量F1~F4外,本文还根据123家企业特点,将企业进行了分类,引入定性变量F5:企业类别;定性变量F6:企业是否违约;衡量企业发展是否稳定,引入变量F7:进稳定度,F8:销稳定度,F9:进销稳定度。这些变量的具体定义如表2所示。本文将建立多元Logit模型,通过上述定义的变量F1~F9,研究它们对企业评级的影响。并由此根据获得的权重再对企业进行评级。按照行业惯例,企业一般按好→差被评为A、B、C、D四级。


3. 模型建立及估计


3.1. 多元Logit模型设定


多元Logit模型可视为被解释变量任意选定基准组后将其他组别与基准组分别配对构成的多个二元Logit模型实施联合估计。模型设定具体如下:

image.png

其中, X=[x1,x2,⋯,xK] 是解释变量, βj=[βj1,⋯,βjK]T 为解释变量的系数, βj0 为截距项,类别变量y有 j=1,2,3,⋯,J 个类别。b为选定的基准组,当 j=b 时,由于 ln1=0,故 βb0=βb=0,即 Gb=0。故在J个类别下,只要估计J-1个模型即可。


通过模型估计,可以得到每种类别选择的预测概率:

image.png

image.png

表2. 变量定义


3.2. 模型估计


针对本文研究的问题共有四个类别,即模型(1)中 j=0,1,2,3,考虑到类别变量,解释变量共十一个,故 K=11。因变量选取 y=3 (A级企业)为基准组,自变量中的定性变量F5选取F54 = 综合类为基准组,F6选取F61 = 有违约为基准组。企业样本数为123个,估计软件为RStudio4.0.5。估计结果由表3给出。


4. 企业评级预测分析


由多元Logit模型估计得到的结果(表3),可获得模型(1)中各解释变量的权重 βj,再把企业的各解释变量值代入模型(1),即可求得企业的机会比率对数值 Gj,j=0,1,2,3,根据公式(2)可以得到企业的信誉评级为A、B、C、D(即y取值为3,2,1,0)的概率如下。

image.png

image.png

image.png

表4. 基于全数据企业评级分类预测胜率表


注:表中括号中的数为实际评为该级别的企业数,后同。


由于小微企业受行业、环境影响较大,企业变化发展很快,所以越靠近评级时点的数据对企业评级预测应该更准确。故本文进一步只选取2019年1月~2020年2月的数据进行建模预测,得各级别企业预测正确率如表5所示。


由表5可得,当获取数据的时间段更靠近预测时间点时,模型分类的准确率有所提高,特别,D级预测正确率仍保持100%,其次亦是A级;中间两级B、C级的预测准确率有所提高。这个结果与相关部门对中小企业信用等级评价结果有效期统一定为三年,相关协会在有效期内对企业每年进行一次复查等政策是完全吻合的。所以用于企业信誉评级的相关数据具有时效性,数据离评价时间越近,对企业评价的准确度越高。

image.png

表5. 基于2019年~2020年数据企业评级分类预测胜率表


5. 结论及政策建议


本文以2017年1月~2020年2月某银行获得的123家有信贷记录且已有评级的小微企业营业数据(进、销项数据)为样本,以Python语言为工具,结合多因子分析方法,建立多元Logit模型研究了这一类小微企业的信用评级问题,结果显示:


1) 基于多元Logit模型对企业进行评级,该方法对两端企业(A、D级)的评级准确率更高。特别,对D级的评级准确率达到100%且结果稳健,这为商业银行在有限信息下甄别较差企业、有效规避不良贷款发生提供了一种有效方法。


2) 当用三年数据进行企业信用评级时,总体评级准确率为66.7%;若改用企业最近一年的数据进行评级,准确率提高了5.7个百分点,达到72.4%。这表明用于企业信誉评级的相关数据具有时效性,交易信息离评级时点越近,评级的准确率越高。这一结论与相关部门对企业评级的信息规范要求相吻合。


本文为在有限信息下针对无抵押、无担保的小微企业评级提供了一种方法。该方法虽然在D级评级上具有较好优势且结果稳健,但在中间级别B、C级的评级准确率上还有待进一步提高。由于本研究只获得123个小微企业数据,数据有限,因此在尝试用其它方法建模时效果欠佳。故,未来在可获得更多数据时,将尝试拓展其它建模方法,特别是近年兴起的机器学习方法用于企业评级预测研究,以获取更好预测效果,为金融机构合理放贷、规避风险提供有效策略。


基金项目


国家自然科学基金项目(11801267)。


2022年江苏省研究生科研与实践创新计划项目(SJCX22_0410)。


NOTES


1数据来源:http://www.mcm.edu.cn/html_cn/node/10405905647c52abfd6377c0311632b5.html。


2由于代码篇幅过长,此处省略,若有需要可联系作者。


3限于篇幅,各主成分荷载具体结果此处省略,若有需要可联系作者。


参考文献


[1] Roggi, O. and Altman, E. (2012) Managing and Measuring Risk: Emerging Global Standards and Regulations after the Financial Crisis. World Scientific, Singapore, 343-455.

[2] 孙雨忱. 信息不对称下银行对中小微企业的最优信贷策略研究——基于Logistic回归的违约率测算模型[J]. 金融发展研究, 2021, 4(6): 78-84.

[3] 高璐冰, 赵国庆, 侯家璇. 基于商业银行视角下中小微企业信贷决策研究[J]. 中国商论, 2021(9): 55-57.

[4] 乔薇. 中小企业信用评级指标体系与模型的构建[J]. 开封大学学报, 2011, 25(4): 89-93.

[5] 徐晓萍, 马文杰. 非上市中小企业贷款违约率的定量分析——基于判别分析法和决策树模型的分析[J]. 金融研究, 2011(3): 111-120.

[6] 郭妍, 张立光, 刘佳. 中小企业信贷风险度量模型研究——基于山东省的实证分析[J]. 东岳论丛, 2013, 34(7): 58-61.

[7] 夏利宇, 张勇, 鲁强, 汤广瑞. 结合XGBoost算法和Logistic回归的信用评级方法[J]. 征信, 2019, 37(11): 56-59.


相关内容
  • 普惠金融选题推荐
     普惠金融选题推荐1. 数字普惠金融在农村地区的发展模式研究2. 区块链技术在普惠金融中的应用与创新3. 人工智能驱动的普惠金融风险管理机制4. 绿色普惠金融对可持续发展的影响分析5. 普惠金融在中小微企业融资中的作用6. 移动支付与普惠金融的融合发展路径7. 普惠金融政策对低收入群体的实效性评估8. 大数据在普惠金融信用评估中的应用9. 普惠金融与社会资本的互动机制研究
  • 银行普惠金融创新发展论文范文
    普惠金融推动包容性增长的机制与创新发展路径研究第一章 引言1.1 研究背景包容性增长是近年来全球关注的经济发展目标之一,旨在实现经济增长与社会公平的双重目标,确保不同社会阶层特别是弱势群体能够共享经济增长的红利。普惠金融的概念由联合国在2005年提出,旨在通过提供全面的金融服务,确保所有社会成员都能平等地获得金融资源,从而实现包容性增长。普惠金融在全
  • 银行普惠金融惠农论文范文
    普惠金融在贫困地区经济社会发展中的作用与创新路径研究第一章 引言1.1 研究背景贫困地区的经济社会发展往往面临融资渠道匮乏、产业结构单一、基础设施落后等问题,这些因素共同制约了贫困地区脱贫与经济发展的步伐。普惠金融旨在通过为所有社会成员提供平等的金融服务,尤其是为弱势群体、农村和偏远地区的居民提供经济可得的金融产品,弥合发展鸿沟,实现经济的包容
  • 银行业普惠金融论文范文
    普惠金融助力可持续经济增长的机制与路径研究第一章 引言1.1 研究背景普惠金融的概念最早由联合国提出,其核心在于为社会各阶层特别是弱势群体和偏远地区的居民提供公平、可得的金融服务。普惠金融的目标在于消除金融排斥,赋能弱势群体,实现经济增长的包容性和可持续性。近年来,随着经济全球化和科技发展,普惠金融在消除贫困、推动小微企业成长、助力经济结构优化
  • 普惠科技金融论文范文
    普惠金融促进城乡经济均衡发展的路径与创新思考第一章 引言1.1 研究背景城乡经济差距是全球许多国家面临的重大社会经济问题之一,尤其是在发展中国家,农村经济的发展远落后于城市,导致居民收入差距不断扩大。城乡经济发展的不平衡,不仅影响国家整体经济水平的提高,也阻碍了社会的稳定与进步。普惠金融作为一种旨在实现金融服务广泛覆盖和公平性的金融理念,能够为
相关推荐
  • 跨国公司企业并购的系统动力学研究—以奔驰并购克莱斯勒公司为例
    关键词: WOTS-UP分析;系统动力学;跨国公司;企业并购;业务建模;摘要: 全球竞争和技术的不断进步正在显著改变企业的格局及其内部报告要求。本文通过对戴姆勒–奔驰公司WOTS-UP分析之前因构型,识别出与该公司未来发展相关的关键因素,并制定适当的策略来预测未来的发展和评估公司适应或利用这些发展的能力,然后通过开发支持战略选择的相关系统,将奔驰、克莱斯勒公司合
热门内容
  • 东方甄选SWOT分析战略
    东方甄选是一家专注于高品质商品的电商平台。进行其SWOT分析可以帮助识别其内部优势(Strengths)和劣势(Weaknesses),以及外部机会(Opportunities)和威胁(Threats)。以下是基于一般情况的东方甄选SWOT分析:优势(Strengths)品质保证:东方甄选可能注重商品的品质,为消费者提供高质量的商品。精准定位:面向追求高品质生活的消费群体,定位清晰。品牌形象:可能建立了良好的品
  • 党史党建论文题目105个
     1.习近平新时代中国特色社会主义思想创立的历史考察,党史·党建 2.习近平总书记关于党史、国史的重要论述研究,党史·党建 3.习近平总书记关于大力弘扬“红船精神”等革命精神的重要论述研究,党史·党建 4.习近平新时代中国特色社会主义思想中加强党的全面领导思想研究,党史·党建 5.习近平新时代中国特色社会主义思想中全面从严治党思想研究,党史·党
  • 数字经济论文好写题目推荐50个
    数字经济论文好写题目推荐50个1“双循环”新发展格局下产业链升级机遇、挑战和路径选择    2从数字经济看自由主义的局限性   3我国数字贸易发展策略研究    4卖空机制如何影响企业数字化转型——理论机制分析与实证检验    5数字巨头跨界扩张的竞争法挑战与应对    6数字经济下的杭州丝绸企业品牌营销转型升级研究   7数字时代推进共
  • 平台效应论文
    关键词: 平台效应;主播效应;感知有用性;摘要: 由于新冠疫情发生,促使电商直播购物方式迅速发展。为助力电商直播的发展,从主播和平台两个方面出发,基于感知–情感–行为意愿(CAC)模型,并以感知有用性和满意度作为中介变量,构建消费者持续使用意愿影响研究模型,并通过问卷调查和结构方程模型进行实证研究。结果表明:主播和平台两个方面对消费者感知有用性和满意
  • 消费者需求论文,市场状况论文
    关键词: 紧平衡;消费者需求;市场状况;供应定位;精准营销;工业和商业摘要: 在“互联网+”和烟草行业信息化水平不断发展的大背景下,经济发展的市场化和国际化迫使中国烟草行业直面严厉的挑战。粗犷的商业投放模式和营销方式,无法适应当今快速变化的互联网市场环境,导致消费者难以挑选到心仪的产品,而企业也无法把适当的产品投向对应的市场,更无从市场导向控制
联系方式
  • 13384015218
  • 13384015218
  • 921006691@qq.com