信用评级论文

2023-02-12 17:35 421 浏览

关键词: 信用评级;Python语言;主成分分析;多元Logit模型

摘要: 首先用Python语言对123家小微企业共约三十七万条交易信息进行分类整理;然后用主成分分析将多种信息归为四类主要因子,并引入定性变量;最后建立多元Logit模型对企业进行由好至差的A、B、C、D四类评级。结果显示:整体评级准确率达到72%;交易信息离评级时点越近,评级的准确率越高;该模型对D级的评级准确率达到100%,说明该方法能有效甄别最差级别企业,为商业银行规避不良贷款发生提供了一种可行性方法。

1. 引言


小微企业是一国经济发展的基础性力量,它们不仅提供大量就业岗位,而且为经济注入活力,在保持社会稳定方面发挥着巨大作用。特别,美、日等发达国家的经验表明,许多今天的巨型企业都是由当初的小微企业发展起来的。但是小微企业由于成立时间短、几无固定抵押资产、缺少资信等特点,在小微企业的成长过程中一直存在融资难问题。近年来,国家出台了一系列扶持小微企业发展的金融政策,引导商业银行等金融机构为小微企业提供融资支持小微企业发展。金融机构一方面要承担起为小微企业融资,支持小微企业发展的社会责任,但另一方面,又要尽可能的减少小微企业的违约风险,以规避金融系统的借贷风险。因此,如何根据能获得的小微企业信息,给企业进行评级,进而针对不同信用级别的企业制定合理的贷款额度和贷款利息是商业银行十分关注的重要问题。


企业信用等级作为商业银行风险管理中重要的组成部分,为信贷决策提供了重要的依据。关于如何对企业进行信用评级以及哪些因素可能会引起企业违约风险,此前已有大量研究。在传统分类模型方面,Altman等(2013) [1] 认为从统计学的角度考虑,Logit模型回归似乎更适合于解决违约预测的问题,在因变量是二进制(是/非)的条件下,组别都是离散的、非重叠的和可识别的;孙雨忱(2021) [2] 通过构建二元Logistic回归的违约率测算模型,测算出不同信用水平下中小微企业的预期违约率;高璐冰等(2021) [3] 使用熵权TOPSIS法计算每个企业的得分,量化信贷风险并确定信用评级,建立二元Logit回归模型确定企业违约概率。在机器学习模型方面,乔薇(2011) [4] 选取了流动资产周转率、净资产收益率等指标建立了AHP模型对中小企业进行多级模糊综合评级;徐晓萍和马文杰(2011) [5] 运用判别分析法和决策树模型,对非上市中小企业的违约风险进行了分析,发现二者结合能较好地判断企业违约率;郭妍等(2013) [6] 建立二元Logit回归模型和LDA模型对我国中小企业信贷风险进行实证度量,对企业是否违约进行预测;夏利宇等(2019) [7] 将XGBoost算法与Logistic Group Lasso模型相结合建立了企业是否违约二分类模型,评估了客户违约风险;白羽等(2021) [8] 通过建立神经网络模型预测企业未违约率,量化分析了企业信贷风险。


综上,目前的研究主要方向是用二元Logit模型和其它包括机器学习方法对企业是否违约的二分类情形进行预测研究。但银行要发放贷款,并且要实施有差异的贷款利率,就需要获得准确的企业信用等级,以按不同等级发放贷款额度和确定贷款利率。目前,对企业进行等级评价这方面的研究较少,特别对几无固定资产、无担保的小微企业的信用评级研究还未见有。如何针对小微企业所提供的有限信息,通过数据处理获取相关特征,对企业进行等级评定,进而为商业银行制定贷款策略提供依据,正是本文研究的主题。


本文研究这样一类小微企业:它们无固定资产,也无信誉担保,在向银行提出贷款时,唯一能提供的真实信息是它们一段时间的大量的“进、销项”财务记录。本文首先用Python语言对初始数据进行处理、分类,提取有用信息;然后利用因子分析法对大量、多维信息进行降维;最后,建立多元多分类Logit模型对企业进行信用评级(按A、B、C、D四类评级),为商业银行更加客观、准确地评估小微企业的信用状况,制定合理贷款额度及贷款利率提供有效参考。


2. 数据处理及变量选取


数据来源于某银行获得的123家有信贷记录且已有评级的小微企业的相关经营信息1,包括:企业进项和销项发票信息、企业类型、企业信用评级等数据,其中进项发票数据共210,948条,销项发票数据总共162,485条。时间2017年1月至2020年2月。


2.1. 数据预处理


首先,运用Python语言对123家经营信息共约38万条原始发票数据进行整合处理2。发票所含直接信息为:企业名称、企业信誉评级、企业是否违约、进项发票金额及税额、销项发票金额及税额、进/销项作废发表、发票号码、开票日期、购/销方单位代号等。引入“有效收入”,“作废发票率”及“负数发票率”定义如下:

image.png

经Python语言处理将发票信息归结为以下几个方面:1) 总发票、有效发票、负数发票和作废发票的数量;2) 有效金额,有效税额,有效价税总和以及作废额;3) 进项和销项发票总数;4) 有效收入、作废发票率、负数发票率等。


2.2. 主成分因子提取


由预处理共计获得19个变量,它们是x1:进项发票数量、x2:进项有效发票数量、x3:进项作废发票数量、x4:进项负数发票数量、x5:进项有效金额、x6:进项有效税额、x7:进项无效额、x8:进项有效价税总和、x9:销项发票数量、x10:销项有效发票数量、x11:销项作废发票数量、x12:销项负数发票数量、x13:销项有效金额、x14:销项有效税额、x15:销项无效额、x16:销项有效价税总和、x17:有效收入、x18:作废发票率、x19:负数发票率。由于变量过多,且一些变量可能存在较强的相关性,不能直接用于评级分析,故进行变量整合,拟采用因子分析法对预处理得到的特征变量进行降维。因子分析使用统计软件SPSS 24。


首先考察原有变量是否适合进行因子分析,利用KMO指标和巴特利特检验进行。KMO指标主要作用是观测相关系数值和偏相关系数值,巴特利特检验用于检验各变量是否独立。KMO和巴特利特检验结果如表1所示。

image.png

表1. KMO和巴特利特检验


由表1可得,KMO = 0.681,根据专家给出的标准,KMO > 0.5,说明所选取的原始变量之间存在强相关性。巴特利特球度检验原假设为相关系数矩阵是一个单位阵,变量无相关性,由结果得显著性为0.000,所以该相关阵各变量之间存在相关性,说明可以做因子分析。


因子提取方法选用主成分分析法,首先计算各因子的特征根,结果显示:特征根 > 1的因子总共4个,且该4个因子已经可以包含原始变量86.225%的信息,所以提取4个公因子。提取的四个主成分因子如下:


第一主成分因子(F1)在指标进项有效金额、进项有效税额、进项无效额、进项有效价税总和、销项有效金额、销项有效税额、销项有效价税总和有较大载荷,这些指标主要反映了这些企业的有效资金情况,所以定义第一主成分因子为“金额因子”;第二主成分因子(F2)在指标进项发票数量、进项有效发票数量、进项作废发票数量、销项作废发票数量有较大载荷,这些指标主要是反映了这些小微企业的各项发票数量,故定义第二主成分因子为“活力因子”;第三主成分因子(F3)在指标销项负数发票数量、负数发票率有较大载荷,这些指标主要是反映了企业入账记税后购方因故发生退货并退款的情况,故定义第三主成分因子为“故障因子”;第四主成分因子(F4)在指标有效收入有较大载荷,主要是反映了这些小微企业收入情况,定义第四主成分因子为“收入因子”3。


通过因子分析对指标降维后,最终确定了上述4个评价指标,分别是F1:金额因子,F2:活力因子,F3:故障因子,F4:收入因子。将分析这些变量对企业评级产生的影响。


2.3. 其它变量确定


为保证研究小微企业评级问题的全面性,除前述经因子分析获得的4个主成分因子变量F1~F4外,本文还根据123家企业特点,将企业进行了分类,引入定性变量F5:企业类别;定性变量F6:企业是否违约;衡量企业发展是否稳定,引入变量F7:进稳定度,F8:销稳定度,F9:进销稳定度。这些变量的具体定义如表2所示。本文将建立多元Logit模型,通过上述定义的变量F1~F9,研究它们对企业评级的影响。并由此根据获得的权重再对企业进行评级。按照行业惯例,企业一般按好→差被评为A、B、C、D四级。


3. 模型建立及估计


3.1. 多元Logit模型设定


多元Logit模型可视为被解释变量任意选定基准组后将其他组别与基准组分别配对构成的多个二元Logit模型实施联合估计。模型设定具体如下:

image.png

其中, X=[x1,x2,⋯,xK] 是解释变量, βj=[βj1,⋯,βjK]T 为解释变量的系数, βj0 为截距项,类别变量y有 j=1,2,3,⋯,J 个类别。b为选定的基准组,当 j=b 时,由于 ln1=0,故 βb0=βb=0,即 Gb=0。故在J个类别下,只要估计J-1个模型即可。


通过模型估计,可以得到每种类别选择的预测概率:

image.png

image.png

表2. 变量定义


3.2. 模型估计


针对本文研究的问题共有四个类别,即模型(1)中 j=0,1,2,3,考虑到类别变量,解释变量共十一个,故 K=11。因变量选取 y=3 (A级企业)为基准组,自变量中的定性变量F5选取F54 = 综合类为基准组,F6选取F61 = 有违约为基准组。企业样本数为123个,估计软件为RStudio4.0.5。估计结果由表3给出。


4. 企业评级预测分析


由多元Logit模型估计得到的结果(表3),可获得模型(1)中各解释变量的权重 βj,再把企业的各解释变量值代入模型(1),即可求得企业的机会比率对数值 Gj,j=0,1,2,3,根据公式(2)可以得到企业的信誉评级为A、B、C、D(即y取值为3,2,1,0)的概率如下。

image.png

image.png

image.png

表4. 基于全数据企业评级分类预测胜率表


注:表中括号中的数为实际评为该级别的企业数,后同。


由于小微企业受行业、环境影响较大,企业变化发展很快,所以越靠近评级时点的数据对企业评级预测应该更准确。故本文进一步只选取2019年1月~2020年2月的数据进行建模预测,得各级别企业预测正确率如表5所示。


由表5可得,当获取数据的时间段更靠近预测时间点时,模型分类的准确率有所提高,特别,D级预测正确率仍保持100%,其次亦是A级;中间两级B、C级的预测准确率有所提高。这个结果与相关部门对中小企业信用等级评价结果有效期统一定为三年,相关协会在有效期内对企业每年进行一次复查等政策是完全吻合的。所以用于企业信誉评级的相关数据具有时效性,数据离评价时间越近,对企业评价的准确度越高。

image.png

表5. 基于2019年~2020年数据企业评级分类预测胜率表


5. 结论及政策建议


本文以2017年1月~2020年2月某银行获得的123家有信贷记录且已有评级的小微企业营业数据(进、销项数据)为样本,以Python语言为工具,结合多因子分析方法,建立多元Logit模型研究了这一类小微企业的信用评级问题,结果显示:


1) 基于多元Logit模型对企业进行评级,该方法对两端企业(A、D级)的评级准确率更高。特别,对D级的评级准确率达到100%且结果稳健,这为商业银行在有限信息下甄别较差企业、有效规避不良贷款发生提供了一种有效方法。


2) 当用三年数据进行企业信用评级时,总体评级准确率为66.7%;若改用企业最近一年的数据进行评级,准确率提高了5.7个百分点,达到72.4%。这表明用于企业信誉评级的相关数据具有时效性,交易信息离评级时点越近,评级的准确率越高。这一结论与相关部门对企业评级的信息规范要求相吻合。


本文为在有限信息下针对无抵押、无担保的小微企业评级提供了一种方法。该方法虽然在D级评级上具有较好优势且结果稳健,但在中间级别B、C级的评级准确率上还有待进一步提高。由于本研究只获得123个小微企业数据,数据有限,因此在尝试用其它方法建模时效果欠佳。故,未来在可获得更多数据时,将尝试拓展其它建模方法,特别是近年兴起的机器学习方法用于企业评级预测研究,以获取更好预测效果,为金融机构合理放贷、规避风险提供有效策略。


基金项目


国家自然科学基金项目(11801267)。


2022年江苏省研究生科研与实践创新计划项目(SJCX22_0410)。


NOTES


1数据来源:http://www.mcm.edu.cn/html_cn/node/10405905647c52abfd6377c0311632b5.html。


2由于代码篇幅过长,此处省略,若有需要可联系作者。


3限于篇幅,各主成分荷载具体结果此处省略,若有需要可联系作者。


参考文献


[1] Roggi, O. and Altman, E. (2012) Managing and Measuring Risk: Emerging Global Standards and Regulations after the Financial Crisis. World Scientific, Singapore, 343-455.

[2] 孙雨忱. 信息不对称下银行对中小微企业的最优信贷策略研究——基于Logistic回归的违约率测算模型[J]. 金融发展研究, 2021, 4(6): 78-84.

[3] 高璐冰, 赵国庆, 侯家璇. 基于商业银行视角下中小微企业信贷决策研究[J]. 中国商论, 2021(9): 55-57.

[4] 乔薇. 中小企业信用评级指标体系与模型的构建[J]. 开封大学学报, 2011, 25(4): 89-93.

[5] 徐晓萍, 马文杰. 非上市中小企业贷款违约率的定量分析——基于判别分析法和决策树模型的分析[J]. 金融研究, 2011(3): 111-120.

[6] 郭妍, 张立光, 刘佳. 中小企业信贷风险度量模型研究——基于山东省的实证分析[J]. 东岳论丛, 2013, 34(7): 58-61.

[7] 夏利宇, 张勇, 鲁强, 汤广瑞. 结合XGBoost算法和Logistic回归的信用评级方法[J]. 征信, 2019, 37(11): 56-59.


相关内容
  • 数字经济时代价值链论文怎么写
    数字经济时代价值链论文提纲框架第一章 引言  1.1 研究背景与意义  1.1.1 数字经济的兴起与发展  1.1.2 价值链理论的演变与应用  1.1.3 研究的目的与意义  1.2 研究问题与方法  1.2.1 研究问题的提出  1.2.2 研究方法与数据来源  1.2.3 论文结构安排第二章 数字经济时代的概念与特征  2.1 数字经济的定义与内涵  2.1.1 数
  • 部分外包,安全外部性论文
    关键词: 部分外包;安全外部性;信息泄露;强制性安全标准;摘要: 信息技术的快速发展不仅方便了人们的生活,同时也给企业和个人带来了更大的安全隐患。为了应对安全风险的挑战,企业倾向于将部分信息安全外包给专业的管理安全服务提供商(MSSP),MSSP旨在通过专业高效的信息安全管理手段来帮助企业提高信息安全质量。因此,本文考虑了部分外包发生时企业和MSSP之间不对称的
  • 生物质燃料论文
    关键词: 生物质燃料;可持续性;可持续认证;摘要: 当前气候变化问题、能源问题严峻及“碳达峰碳中和”压力较大的背景下,生物质燃料的关注度不断提升。本文从产能、技术、可持续性等方面入手,深入分析了生物质燃料发展过程中存在的问题,指出当前主流可持续性认证体系中的评价指标、碳排放核算方法等同我国国情的不符之处,为加快构建我国特色的生物质燃料可持续性
  • 顾客欣喜,顾客契合行为论文
    关键词: 顾客欣喜;顾客契合行为;顾客承诺; 摘要: 围绕移动购物情境,本研究挖掘顾客欣喜对顾客契合行为的影响机理,并探索这一关系链中有中介的调节机制。研究发现顾客欣喜显著且正向影响契合行为,这一关系受到网上购买经验的负向调节作用和顾客承诺的中介作用,且交互项通过顾客承诺间接影响顾客契合行为。研究结果为移动商家长期维系顾客有一定的借鉴意义。1.
  • 冷链物流论文
    关键词: 冷链物流;配送车;车厢内部优化设计;生鲜产品;摘要: 随着生鲜电商销售行业的快速发展,小规模多品种冷藏配送频率越来越高。文章在基于快递配送车研究现状的基础上,对冷链物流末端配送车应用现状进行调研,目前冷链物流末端配送车应用方面存在车厢容积利用率低;冷链配送作业取货不方便且效率低;制冷效果受到频繁开关小车门的影响三个方面的问题。因此对
相关推荐
  • 跨国公司企业并购的系统动力学研究—以奔驰并购克莱斯勒公司为例
    关键词: WOTS-UP分析;系统动力学;跨国公司;企业并购;业务建模;摘要: 全球竞争和技术的不断进步正在显著改变企业的格局及其内部报告要求。本文通过对戴姆勒–奔驰公司WOTS-UP分析之前因构型,识别出与该公司未来发展相关的关键因素,并制定适当的策略来预测未来的发展和评估公司适应或利用这些发展的能力,然后通过开发支持战略选择的相关系统,将奔驰、克莱斯勒公司合
热门内容
  • 党史党建论文题目105个
     1.习近平新时代中国特色社会主义思想创立的历史考察,党史·党建 2.习近平总书记关于党史、国史的重要论述研究,党史·党建 3.习近平总书记关于大力弘扬“红船精神”等革命精神的重要论述研究,党史·党建 4.习近平新时代中国特色社会主义思想中加强党的全面领导思想研究,党史·党建 5.习近平新时代中国特色社会主义思想中全面从严治党思想研究,党史·党
  • 东方甄选SWOT分析战略
    东方甄选是一家专注于高品质商品的电商平台。进行其SWOT分析可以帮助识别其内部优势(Strengths)和劣势(Weaknesses),以及外部机会(Opportunities)和威胁(Threats)。以下是基于一般情况的东方甄选SWOT分析:优势(Strengths)品质保证:东方甄选可能注重商品的品质,为消费者提供高质量的商品。精准定位:面向追求高品质生活的消费群体,定位清晰。品牌形象:可能建立了良好的品
  • 数字经济论文好写题目推荐50个
    数字经济论文好写题目推荐50个1“双循环”新发展格局下产业链升级机遇、挑战和路径选择    2从数字经济看自由主义的局限性   3我国数字贸易发展策略研究    4卖空机制如何影响企业数字化转型——理论机制分析与实证检验    5数字巨头跨界扩张的竞争法挑战与应对    6数字经济下的杭州丝绸企业品牌营销转型升级研究   7数字时代推进共
  • 党史论文选题精选88个
    •1.习近平总书记关于中国共产党历史重要论述研究,党史·党建,2022•2.习近平总书记关于坚持唯物史观、正确党史观重要论述研究,党史·党建,2022•3.习近平总书记关于坚持和加强党的全面领导重要论述研究,党史·党建,2022•4.习近平总书记关于推进党的自我革命重要论述研究,党史·党建,2022•5.习近平总书记关于依规治党重要论述研究,党史·党建,2022•6.树立正确历史认知
  • A企业仓储中心拣货流程优化研究
    第1章绪论1.1研究背景和意义1.1.1研究背景随着互联网技术的覆盖范围越来越广,电子商务平台因依托于互联网也在不断迅猛发展中。自2013年起,我国已连续八年成为全球最大的网络零售市场。根据中国互联网信息中心(CNNIC)统计调查发布的第47次《中国互联网络发展状况统计报告》显示,2020年,我国网上零售额达到11.76万亿元,较2019年增长10.9%。截至2020年12月,我国网络购物用户规
联系方式
  • 13384015218
  • 13384015218
  • 921006691@qq.com