分类模型的常见度量指标(模型评估指标之间的一些联系)
分类模型的常见度量指标(模型评估指标之间的一些联系)
2024-07-01 11:42:28  作者:你眼瘸呀  网址:https://m.xinb2b.cn/life/zjg244770.html

信贷评分模型的评估指标常见的有P-R曲线、AUC、KS、混淆矩阵、AR、洛伦茨曲线等,各个评估指标之间都有或多或少的联系和区别,从而从不同角度对模型进行评估。本文尝试写一些各个评估指标间的联系,从而对模型评估指标有更加深入的理解。

目录

正负样本的选择混淆矩阵与概率密度分布提升图与洛伦茨曲线洛伦茨曲线与KSKS与AUC值参考资料

一、正负样本的选择

直观上,在信贷风控建模中都以好样本为正样本,以坏样本为负样本。其实正负样本的选择不同直接影响的就是混淆矩阵,在以好样本为正样本的情况下,信贷业务的一些指标如通过率与坏账率如下:

通过率,即模型判断为好样本的数量占总样本的数量。

分类模型的常见度量指标(模型评估指标之间的一些联系)(1)

坏账率为模型判断为好样本(P)中真正的坏样本(FP)所占的比例。

分类模型的常见度量指标(模型评估指标之间的一些联系)(2)

而模型的准确率Precison定义为模型判断为好样本中真正的好样本所占比例,即:

分类模型的常见度量指标(模型评估指标之间的一些联系)(3)

由此可见,坏账率就是1-Precison,在模型优化时设法让Precison值更高,即通过样本中的好样本占比尽可能高,这是一个很好的性质,也是将好样本作为正样本的优点。但同时其他的一些指标比如F1指标,这个时候就是无效的。

在机器学习中,往往是将少数样本定义为正样本,在信贷模型也就是将坏样本定义为正样本,表示希望模型在训练时更加关注坏样本,控制模型对坏样本的预测能力,这也更符合业务场景。

总结一下,正负样本的选择没有强制要求,根据自身需求而定,不同正负样本的选择会对指标的表现方式产生影响。

二、混淆矩阵与概率密度分布

为了便于理解,以好样本为正样本,将混淆矩阵与正负样本的概率密度函数对应到一张图上:

分类模型的常见度量指标(模型评估指标之间的一些联系)(4)

虚线左边为拒绝的样本,即经模型预测低于cutoff值的坏样本;右边为通过的样本,即经模型预测高于cutoff的好样本。FN为模型预测为坏样本但实际为正样本,即被误拒的好人;FP为模型预测为好样本但实际为坏样本,即误准入的坏人。

TPR为预测为正例且实际为正例的样本占所有正例样本的比例,即所有好样本中通过样本的占比。

分类模型的常见度量指标(模型评估指标之间的一些联系)(5)

FPR为预测为正例但实际为负例(误准入)的样本占所有负例样本的比例,即所有坏样本中被误准入的样本占比。

分类模型的常见度量指标(模型评估指标之间的一些联系)(6)

由于KS值是取TPR和FPR之差的最大值,可以理解为两个累计分布之差。以上图中的cutoff值为例,虚线往左移则TP增加的比例要小于FP增加的比例,虚线往右移则TP减少的比例大于FP减少的比例,因此只有在虚线处TP的占比与FP的占比差值最大,也就是KS的取值。所以上图中三条线交叉的地方取到的cutoff值,正好为KS值对应的cutoff值。

三、提升图与洛伦茨曲线

提升图比较的是采用模型与不采用模型带来的改善,即采用模型后对坏样本识别能力的提升程度。计算过程如下图:

分类模型的常见度量指标(模型评估指标之间的一些联系)(7)

上图中的右侧有两条曲线,绿色的这根是Lift曲线,它是将每一组的坏样本占比除以整体的坏样本占比得到。这条曲线是趋于0的,且越陡说明模型的区分度越高。还有一根蓝色的曲线是累计的Lift曲线,是将累计的坏样本比例除以整体的坏样本占比所得,这条线是的临界点是1。

如果将用模型判断得到的每组累计坏样本占比与随机判断每组的累计坏样本占比进行绘图,就得到洛伦茨曲线,计算方式如下图:

分类模型的常见度量指标(模型评估指标之间的一些联系)(8)

洛伦茨曲线如下:

分类模型的常见度量指标(模型评估指标之间的一些联系)(9)

用洛伦茨曲线比较模型性能时,较好的模型的洛伦茨图应该更偏向于左上方坐标轴,这种比较模型性能的方式与ROC曲线相同。上图中洛伦茨曲线上一点的含义是:在通过率为50%的情况下,模型可以识别出80%的坏样本。

分类模型的常见度量指标(模型评估指标之间的一些联系)(10)

现在知道洛伦茨曲线越往左上方说明模型的性能越好,因此可以用一个指标来量化这种性质,如上图将图形分为A、B、C三块区域,理想状态下A的面积等于A B的和,此时可以完美地识别所有坏样本。因此,将A和A B的比值定义为基尼系数,也叫作AR值。

四、洛伦茨曲线与KS

洛伦茨曲线中在给定通过率后,只能得到对坏样本的识别能力,并没有反应对好样本的识别能力。而K-S曲线的本质是对坏样本的洛伦茨曲线和好样本的洛伦兹曲线构成的。

分类模型的常见度量指标(模型评估指标之间的一些联系)(11)

所以,上图中坏样本的累计占比曲线就是FPR,好样本的累计占比曲线就是TPR。上图中KS值为0.36,其含义是在通过率为62%时,模型能识别70%的逾期用户,但有34%的好样本被误判为坏样本拒绝。

KS值的高低与建模样本中的坏样本浓占比相关,并不是KS值越高风控就越好。下面是知乎"独孤qiu败"文章中的一个例子:

(1)如果建模样本中好坏样本比例good/bad=50/50,坏账率为50%;k-s值0.6指的是如果在误杀20%好用户的情况下可以识别80%的坏样本;那么使用模型之后的结果为good/bad=40/10,坏账率变为20%;这个我们做风控策略的人都知道在使用一些较好的变量的情况下是有可能的,因为毕竟做到50%的坏账已经是够烂的了。(2)如果建模样本中好坏样本比例good/bad=80/20,坏账率为20%;k-s值0.6指的是如果在误杀20%好用户的情况下可以识别80%的坏样本;那么使用模型之后的结果为good/bad=64/4,坏账率变为5.88%,其实我们知道这个一个模型是很难做到。

五、KS与AUC值

这一部分直接搬运求是汪的文章了,风控模型—区分度评估指标(KS)深入理解应用。

分类模型的常见度量指标(模型评估指标之间的一些联系)(12)

因为KS = |TPR - FPR|,如果添加辅助线TPR = FPR KS,那么这条直线的截距就是KS值。当与ROC曲线相切时,截距最大,也就对应max_ks。

在理解KS和ROC曲线的关系后,我们也就更容易理解——为什么通常认为KS在高于75%时就不可靠?我们可以想象,如果KS达到80%以上,此时ROC曲线就会变得很畸形,如下图:

分类模型的常见度量指标(模型评估指标之间的一些联系)(13)

六、参考资料

1.《Python金融大数据风控建模实战》

>【作者】:Labryant

>【原创公众号】:风控猎人

>【简介】:某创业公司策略分析师,积极上进,努力提升。乾坤未定,你我都是黑马。

>【转载说明】:转载请说明出处,谢谢合作!~

  • nba2k20名宿易建联在哪一队(NBA2K系列BUG级球员排行)
  • 2024-07-01NBA2K系列BUG级球员排行相信不少篮球迷们都玩过NBA2K系列游戏,从最早火起来的NBA2K9,到如今的2K18,让玩家们津津乐道,我们关注的不仅仅是球员的能力值,还有游戏的体验游戏毕竟还是游戏,永远不可能像现实一样平衡,而这。
  • 曹雪芹写红楼梦他真正的目的(曹雪芹凭什么能写出红楼梦)
  • 2024-07-01曹雪芹凭什么能写出红楼梦《红楼梦》是中国四大名著之一,也是闪耀世界的“千古奇书”而曹雪芹,一生只写了这一本,留下两句残诗,就成就了他在中国的文学史上的独特地位曹公年轻时候“放浪形骸”,与一班八旗子弟相交因为叛逆被家里人关了“。
  • 划分句子成分(有什么特点)
  • 2024-07-01有什么特点现代汉语里一般的句子成分有六种,即主语、谓语、宾语、定语、状语和补语定义:主语是句子陈述的对象,说明是谁或什么.表示句子说的是什么人或“什么事”.主语是执行句子的行为或动作的主体特点:A、经常由名词、。
  • 舌头最怕出现这10种变化(舌头吐露的身体秘密)
  • 2024-07-01舌头吐露的身体秘密后台读者发来了“求救”信:您好,想咨询一下关于舌头的问题,最近一阵子早上起来的时候,照镜子,总发现自己的舌头边缘有锯齿状的纹路,一开始我以为是上火了,所以也没太在意但是现在持续了好长时间了,这要紧吗?。
  • 怎么写别人的文案(案例情歌告诉你)
  • 2024-07-01案例情歌告诉你“池塘边的榕树上”,即使不在KTV,听到这句歌词,大多数80后,也能毫不犹豫的接着唱,“知了在声声的叫着夏天”顺背如流,像背古诗词基本上,看你跟着什么歌合唱,就能给你的年龄断代了60后很执着▼任时光匆。
  • 查看电脑配置参数详细(win10系统怎么查看电脑配置)
  • 2024-07-01win10系统怎么查看电脑配置很多用户都对自己电脑的具体配置信息不太了解,有时候想起来想要查看一下电脑的配置信息要怎么做呢?具体操作如下:1、打开微软小娜,搜索directx,找到最佳匹配结果点击打开,2、在弹出的窗口中,我们就可。
  • 三原市广告牌拆除(破损广告牌整治清隐患增颜值)
  • 2024-07-01破损广告牌整治清隐患增颜值来源:保定日报作者:井雪松近日,唐县社情民意办联合唐县行政执法局对辖区内违规广告牌进行集中整治,对违规设置和破损广告牌发现一处治理一处,及时消除了安全隐患,巩固了创城成果近期,该县社情民意办在微博上接。
  • 玉米面粉可以做什么食物(一个玉米一把面粉就能做)
  • 2024-07-01一个玉米一把面粉就能做今天分享一个不那么好看,但是比较好吃的做法吧这个多做点也没关系,我家都是大人抢着吃By点妈辅食用料玉米一个(带皮)面粉30克做法步骤1、面粉的量要看玉米的大小和水分,步骤图中会有调好的状态,以最后状态。
  • 糖尿病无糖饮食真的没有糖吗(糖尿病患者全球最多)
  • 2024-07-01糖尿病患者全球最多统计数据显示,我国已成为全球糖尿病患者数量最多的国家之一2021年中国糖尿病报告患者人数达140.9百万人占全球报告总人数的26.2%因此,普及健康知识提升大家对糖尿病的重视和管理显得格外重要那么,糖。
  • 梦见南瓜什么吉兆(梦见这些植物水果)
  • 2024-07-01梦见这些植物水果在睡梦中总会梦到各种各样的东西,那么梦到植物有着什么样的预示呢?小编带大家看看周公是怎么说的吧:1.苹果:梦见苹果,是成功和长寿的祥兆梦见匡里有很多熟透了的苹果或桌子上摆着许多熟透了的苹果,会中奖,或。
  • 树下埋盐多久树能死(树下埋盐多长时间树能死)
  • 2024-07-01树下埋盐多长时间树能死树下埋盐多久树能死要看盐的用量以及树的生命力盐对树木的伤害是比较大的,如果浇灌浓盐水,一般一个月左右树木就会死有的树木有一定的耐盐碱性,这样的树木用盐水浇就不容易死想要让树木死亡,还可浇灌开水,多浇几。
  • 咏海棠最好的一首诗苏轼(鬓边不是海棠红火了)
  • 2024-07-01鬓边不是海棠红火了“只要你愿意,我就一直陪着你吧!”《鬓边不是海棠红》越播越渐入佳境,豆瓣评分已经飞涨到了7.4,已经是2020年以来国产剧的最大黑马小海棠不得不吹爆《鬓边》的服道化,堪称”良心”,那质感,那绣花,肉眼。