征信|风控 导图整合文|大数据征信应用系统及启示
京东实在是一个令人着迷的现实存在的案例模型,研究途中发现了其投资的ZestFinance作为其大数据分析公司,所谓不吃饭也要吃透!不弄好根本不想吃饭啊!
该文背景
北京时间6月26日晚间消息,京东(Nasdaq:JD)周五宣布,将与美国大数据分析公司ZestFinance合作推出一个中国消费者信用数据系统,根据京东和ZestFinance今日发布的联合声明,两家公司将成立合资公司JD-ZestFinance Gaia,利用ZestFinance的机器学习技术来分析京东在线买家的数据,制定出信用风险评分。
ZestFinance是美国一家提供金融服务的科技公司,利用机器学习算法和数据技术帮助用户做出更精准的金融风控及营销决策。JD-ZestFinance Gaia的竞争对手包括阿里巴巴旗下蚂蚁金融服务集团的个人征信系统“芝麻信用”,这些公司均试图利用电子商务网站的大量购物数据来制定出一个可靠的信用风险评分。
京东在一封电子邮件中称,合资公司计划推出的信用资料的数量将接近于京东的用户总量(超过1亿)。京东还表示,这款信用模型将率先应用于京东金融的消费金融体系,但将来还计划将这项技术共享给全行业合作伙伴,如P2P借贷平台。
在中国,由于缺少公开的数据,以及各金融机构之间共享的信息量较少,为个人和企业制定准确的信用风险评分是件很困难的事情。但如果能制定出准确的信用风险评分,其价值也是极高的。例如,在向用户提供贷款时可以做出准确的评估。
名词解释
征信是依法收集、整理、保存、加工自然人、法人及其他组织的信用信息,并对外提供信用报告、信用评估、信用信息咨询等服务,帮助客户判断、控制信用风险,进行信用管理的活动。征信就是专业化的、独立的第三方机构为个人或企业建立信用档案,依法采集、客观记录其信用信息,并依法对外提供信用信息服务的一种活动,它为专业化的授信机构提供了信用信息共享的平台。
大数据征信
与央行传统信用报告不同,大数据时代抓取大数据征信进行分析、建立风险模型。
01.央行征信报告属于传统方式获取征信报告,大数据征信数据来源广泛,从各个维度抓取数据进行整合,权威性低于央行征信,与央行征信结合起来,其模型更有保障。
来源:大数据征信应用与启示——以美国互联网金融公司ZestFinance为例 大数据征信来源及解决问题02.相比传统的征信方式,大数据信用采用云计算技术,从数据录入开始到评价结果输出的整个过程全部由计算机算法完成,避免了主观判断的影响,确保评价结果的真实性;即使同时处理多个受评对象,仍然能够保证快速、准确的高效性。市面上一些产品,例如神州融与阿里云的合作,获取第三方数据,用来进行信用模型的整合。可以深度挖掘用户信息的同时,防范潜在的信用风险,不进能够进行有效的风险控制又能使得信用系统的数据来源更加精细。而大数据的核心在于数据的交叉与流动,依赖大数据风控主要靠及时更新的数据和对客户的约束力来实现其有效性,这两个因素也被称为“闭环数据”。虽央行获准8家机构可进行信用获取,但相互间并没有融合性,难以达到目标。
TurboFinancialGroup首席风险官顾凌云先生认为,真正的信用评估应该包括传统的数据、可替代的数据、用户网上行为数据、社交网络信息、用户自己回答的信息,要把所有这些信息全部给综合起来才可以。
网络图片(来源:网络)上图反映了一个典型的信贷风险评分模型的预测能力,弯曲幅度越大,或与直线型随机模型偏离越多,说明评分对经营失败的预测能力越强。当包括财务数据时,信贷评分的预测能力最强;在没有财务数据,但包括贸易数据的情况下,评分的预测表现与最佳模型表现基本相同。
大数据征信的数据处理
大数据征信的数据处理过程,分析模型,分类及其他系统,可由上图了解。
京东合作的ZestFinance
01.从征信系统发展领先的美国来讲,征信数据抓取,除金融相关数据外,还有电商、电信业、零售业的数据等。美国征信市场的特点较为清晰,其分工明确各司其事。整个征信体系分为机构征信和个人征信,其中机构征信又分为资本市场信用和普通企业信用。就我国形势来看,征信整体系统自1999年还处于初级阶段,无论从传统央行征信还是现今其他机构,都没有协调数据来源,进行合理大数据分析,没有形成一个成熟的产业。
02.与京东合作的ZestFinance,认为其使命是为每一个人创造公平而且透明的信用信息。他们希望通过搜集证据,证明信贷信息不完整人群的真正的信用状况,进而帮助他们实现享受正常金融服务的权利,因而扩展了传统征信报告里说的信用不良的人群。
大数据征信视角和传统征信视角的比较 来源:美国ZestFinance公司大数据征信实践 作者 刘新海、丁伟和传统征信相同,ZestFinance公司大数据征信对消费者的信用评估也是基于两个基本面的信息:消费者的还款能力和消费者的还款意愿。所不同的是,传统征信中,数据依赖于银行信贷数据,而大数据征信的数据并不仅仅包括传统的信贷数据,同时也包括了与消费者还款能力、还款意愿相关的一些描述性风险特征,这些相关性描述风险特征的抽取与筛选是ZestFinance的技术核心(如下图)。相比于传统征信数据的强相关性,这些大数据征信的数据和消费者的信用状况相关性较弱,ZestFinance就利用大数据技术搜集更多的数据维度来加强这些弱相关数据的描述能力。这样就使大数据征信不依赖于传统信贷数据,可以对传统征信无法服务的人群进行征信,实现对整个消费者人群的覆盖。
03.ZestFinance导图
ZestFinance基本框架解析04.大数据征信对中国征信业的启示
在国内信贷相关行业工作过就知道,目前的征信系统排除了大批的服务人群,征信不良即一直不良,没有从多角度多维度重新获取一个个体的信用数据,所带来的是失信,各个机构不良资产的增多。京东和ZestFinance的合作意图旨在能够服务更多的人群,能够使各个个体获得公平信贷的机会。同时,由于我国信用体系还未完善,消费、买卖的记录数据不多,也会给大数据征信的模型构建及授信带来困难。合理的选择客户人群,利用数据抓取进一步完善我国的消费信贷、保理等其他业务。
京东金融的消费金融体系,与ZestFinance合作构建并开拓国内信用消费市场,模型建立的初期仍旧需要大量的多方面的数据作为核心基础,并不断的完善模型。
后来看了几篇新闻,京东愿意共享这项技术给全行业合作伙伴,完成之后在消费金融征信模型上,风控的把握就更利于控制了。这是一篇整合的文章,主要研读了刘新海、丁伟的论文及其他新闻,利用导图分享,更易于理解。
对保理业务不甚理解,暂时没有关注到供应链金融及其他部分。
读累了,要不看看诗文? 情诗|趁我还能,琢磨首诗给你