什么叫信贷数据分析(信贷数据集)

什么叫信贷数据分析?最近有很多热心观众都想知道答案。还有一部分人想知道信贷数据集。对此,碳百科整理了相关的教程,希望能对你有所帮助。

信贷业务有对公与对私之分,由于信贷业务模式的差异,风险把控方式不同,对于授信额度策略自然非常不同。


目前对公业务中,常规的做法是借助信用评级方法对现有的企业进行信用评价,综合判断后再输出相关授信额度。目前银行借助做信用评级业务的两家第三方公司,穆迪投资服务(Moody’s Investors Services)和标准普尔公司(Standard&Poor's),这两家国际上较为权威的两大信用评级机构判断企业风险。这两家国际化的公司自然对西方市场的信用评价体系自然非常擅长,但在本地化的过程中仍有一些水土不服。


本来对企业的信用评分判断就不是一件非常容易的内容。特别是在中国,小微企业占90%份额,数据缺少标准化不谈,还有更多的业务不在台面交易。想从数据上进行评价,想想我们广大人民群众的智慧也会为这个信用评价的可靠捏把冷汗。我们指望外来的和尚会念经,但是这次似乎越来越多的风控从业者的为其专业打上问话。


To b的授信额度不是一件容易的事情,那to c业务呢?面对的问题同样是to b不容小觑的。授信额度最重要的两点,一个是衡量其收入,一个是判断其支出。当我们确认借贷方的收入是稳定的,金融机构肯定能给与其高额额度。传统的房贷业务中,会要求客户提供工资流水。只要月均流水是其房贷的2~3倍,贷款即可批复。


这流水有多水,大家心知肚明。既然银行知道这水深,为啥还要批贷?你以为银行看中的是流水?其实风险早就在那三成或五成首付,以及其抵押不动产的风险中抵消了。买的不比卖的精明。现在市场行情不好,银行对客户风险把控严格。但在经济较好的时候,房价上涨,银行看重的不就是你(贷款者)这样的不动产么?您可以选择别还贷,反正银行的手中可是握着大家最重要和保值的资产。


流水、黑名单、多头,这些风控特征都是风险把控要素。特别是流水中的多头借款。每一家银行都恨不得能将你的流水详情一一核查背诵,如果判断中其有非常严重的多头借贷行为一律拒贷。但流水这样敏感的信息,监管单位早就发文属于公民最需要保护一类信息,任何机构都不能直接查询和存储。所以这些风险特征虽然好用,也最不可能轻易得到。直取不行,智取总可以了吧?


方法总是是有。做风控的童鞋早就深谙此道。把控风险不能凭借流水判断,更不能直接凭借客户提供 的流水判断。那我借助外部的征信数据以及人行征信机构,总能判断风险,为客户输出额度了吧。


以下,我们介绍基于人行征信数据,输出风险特征的方法具体量化信用风险,并基于此方法输出相关的授信额度,效果也还可以。


征信数据是判断客人风险最重要的数据来源,但征信数据可不是每家公司都能获取,至少持机构才能有获取征信权限。如果没有征信数据,后续我们出个通过三方数据输出额度模型的专题供大家参考。


回到主题。本次的流水中的支出会从以下几个维度的贷款中获取,数据是依次从PBOC机构获取,维度参考主要有以下几类,

分别是:

1.车贷

2.房贷

3.抵押贷

4.经营贷

5.大额贷

6.小额贷

7.消费贷

8.贷记卡

9.信用长度


以上所涉及的数据维度中,都是在PBOC中都是可以直接获取的信息。获取到了此数据后,如何进行相关的数据整合呢?每个数据的维度的权重又该如何评估呢?


做授信额度的内容中,我们需要了解几个概念。分别是:一个是基础额度,一个是额度区间,一个是盖帽额度。


基础额度是我们在授信之后,给客群的最基本的额度,可以理解为保障额度,只要过了授信的人群必须有的额度。

额度区间是该客群在数据维度中,所划分的等级中额度梯度的数值,而且在后面的测算中每个区间都有具体的额度系数,记住这里又带出来一个系数的概念,其非常重要。

盖帽额度,即封顶额度,每个产品都有其额度上限,所以与其相应的基础额度就是下限区间。


清楚以上的基础概念后,咱们来看如何给客群确定一个具体的额度,只要额度区间划分得足够细。一人一额度,千人千面不难实现。


在映射到上面的额度基础概念后,我们再来看会刚才提到的9个数据维度。这里我们拿第1中的车贷为例说明。


车贷,汽车贷款。在具体到具体的数据维度后,其实会包括三方面的内容,分别是:

a. 车贷金额

b. 车贷已还比例

c. 车贷已还额度


为什么卡这三个方面,因为在贷款逻辑中我们始终把控:金额+还款额越大越好,还款额+还款比例越大越好。这是在车贷产品,同样在房贷产品适用。但在贷记卡数据中,却相反,比如已使用额度越大越好,因为代表着客户越有资金需求。


在上面提到的abc这三个细节中,我们依旧会有相应的系数,这三个系数具体会有客群对应所在的额度区间决定。额度区间,又回到开始时候我们介绍的概念。那如何确定一个具体客群的额度区间。我们上面提到过只要区间划分得足够小,千人千面都有可能,比如划分1个100等分的区间。但在实际落地过程中,我们一般取某个数值维度在10个或20个等分区间就OK了。参考如下:


很多公司做客群授信额度这么细腻,从细节上说是好,但似乎价值也不大。


只要求出车贷的测算方法,同样的方法我们运用到房贷、抵押贷、经营贷、大额贷、小额贷、消费贷、贷记卡、信用长度这些方面上。


其中信用长度是指客户拥有征信数据的年限,信用长度越长,我们越能判断客群风险,一般而言长度越长,所累计的信用额度越高。


在以上所分析的数据维度中,最复杂的不是房贷、车贷等这些消费贷款,而是贷记卡数据。因为贷记卡中会涉及到近期用卡数据,这里会牵涉到近6个月卡可用比例、近6个月可用额度、单卡最高额度、卡平均授信额度等这些内容,综合加权就稍微复杂。但复杂贵复杂,仍有处理的办法。大家可以进一步思考。当然之前在我们的知识星球中,关于额度模型沃恩早就跟大家解答过一版内容,可以留下邮箱发送下相关额度资料信息,后续有问题欢迎在星球上面与我们交流,感谢大家。



~~~~end~~~~


注:以上图文资料均来自番茄学院《番茄风控大数据》知识星球与相关专题课内容


我们坚持为大家带来输出系列风控干货内容,欢迎广大风控爱好者关注 : 番茄风控大数据

本文地址: https://www.tanjiaoyicn.com/n/11107.html

版权声明:本文内容部分来源互联网用户自发贡献或其他公众平台,版权归原作者所有,内容仅供读者参考,如有侵权请联系我们,一经查实,本站将立刻删除,如若转载,请注明出处。

发表评论
登录 后才能评论
评论列表(0条)

    联系我们

    93840186

    在线咨询: QQ交谈

    邮件:baban38@163.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注微信