关于构建大数据信用风险评价体系的对话:南方网专访鹏元数据CEO张
采访背景:
2018上半年,国内债券市场可谓是雷声连连。上半年违约债券253.01亿元,同比增长47.13%。违约债券25只,违约主体增至13家。仅仅上半年债市违约的数字已经超过2017年全年,而且从目前来看,只有加速度,没有减缓迹象。与此同时,大规模实质性债券违约事件引发整个信用评级行业“地震”,针对债券评级机构存在的评级虚高、评级泡沫,未能有效揭示信用风险等问题,2018年度证券评级机构常规现场检查相关工作于6月启动。随即,8月17日,北京证监局联合中国证券业协会对大公国际资信评估有限公司开展专项检查,发现存在内部控制机制运行不良的问题。北京证监局依据《证券市场资信评级业务管理暂行办法》,拟责令大公国际限期整改,期限一年,整改期间不得承接新的证券评级业务。信用评级行业的“顽疾”随之露出水面,评级机构的公信力逐渐遭受质疑。在这样的背景下,评级机构应该如何应对?又应当如何转变?对此,南方网采访了深圳前海鹏元数据技术有限公司CEO张智英先生。
Q&A:
南方网记者:现如今,大公国际遭受严厉处罚,使得评级机构再次陷入被质疑的“漩涡”,债券市场投资人士对于评级机构给予的债券评级纷纷提出疑问,箭头更是直指评级虚高、评级泡沫、未能有效揭示信用风险等焦点话题;那么作为评级行业的老兵,请问是哪些原因导致目前信评行业的乱象呢?
张智英先生:各位南方+ 南方网的网友们,大家下午好!针对刚才主持人提到的问题,我认为原因还是比较多的。在我看来,主要有三个重要的原因导致中国信用评级行业的乱象。
首先根本的原因就是收费模式问题。因为我们国内的收费模式是采取发行人付费模式,这种模式就很容易导致一个结果——评级机构与发行人之间存在利益冲突的情况,从而影响评级机构的独立性。讲到这里,有些网友可能会有不理解,实际在国际上,标普、穆迪、惠誉三大评级机构现在也是发行人付费模式,为什么它们的付费模式就不会带来独立性受到冲击的问题?事实上不是我们中国的评级机构受影响,标普、穆迪、惠誉三大评级机构在独立性方面也曾因为收费模式的问题受到过很大的质疑。2008年美国次贷危机之后,美国华尔街也对三大评级机构提出很大的质疑,为什么他们在主体评级的时候,相对来说它的独立性把握比我们国内的评级行业要好一些呢?我认为主要还是它们整个市场评级收入的规模比较大。比如说标普仅2018年上半年的收入达到了32亿美元,穆迪也是23亿美元,单个客户收入规模占整个收入比很低;另外,三大评级机构也有一百多年的历史,它的品牌价值很高,同样是发行人付费的模式,它的独立性受到冲击的可能性就会小很多。而我们国家整个评级行业刚起步,所以受到的影响比较大。2015年有一部《大空头》的电影,其中里面有一句很经典的台词:“如果我们不这么评,人家就去隔壁的穆迪评级了。”这就说明收费模式会影响到评级机构的独立性。
第二大原因是评级技术积累不足。受第一个因素影响,以及经营成本的压力,我们国家从这二、三十年评级行业的发展来看,整个行业在评级技术的投入方面还是相当不够的。评级技术的投入主要体现在评级的信息化、科技化方面的投入,国内评级机构的评级因为科技投入少,所以它相对来说对人的依赖比较大,这会带来两方面的影响:第一方面的影响是我们这些有经验的分析师随着中国债券市场的发展,大量地被保险、券商、基金这些大的金融机构给挖走了,因为对人的依赖,人才走了之后,造成整个评级机构的评级机制和水平徘徊不前,就因为没有得到一个很好的沉淀,从而无法得到很好的提升。对个人依赖大的第二个方面的影响就是,包括这次大公被证监局检查出问题的时候,因为它主体内控出了问题,内控一旦出问题,它就很容易存在利益冲突,这就导致它们的客观性受到很大的影响。虽然这个机构本身不想做损害市场评级的事情,但是可能因为某些人受到这个方面的影响,就导致它的客观性出现问题。
第三大原因是对评级结果的过度使用问题。从某种意义上来说,我们国家现在债市监管这一块,对评级结果有点过度使用的情况,比如证监会规定的发行环节,要求要AA以上才能发行债券,这导致的结果就是所有评级机构大部分都把评级定在AA之上,要不然它就发不出来。如果你评得低的话,发行人就会聘请其他的评级机构帮它评。这三个因素综合在一起,就导致我们现在97%的债券都在AA以上,也即市场上14000多只债券有AA以上的级别。
造成这一现状,我认为这三个原因是比较深刻的影响因素。
Q&A:
南方网记者:据了解,您作为债券信用评级行业的资深专家,却在2016年离开鹏元资信创立了鹏元数据,专门为投资者提供有价值的大数据信用风险评价服务,打造了国内首个大数据债券风险预警平台-“it-SaiD它说”,并取得了优秀的市场口碑,请问您创立鹏元数据的初衷是什么?
张智英先生:作为一个评级行业的老兵,对行业里的问题看得比较多,也有比较深刻的理解,总想去解决问题。比如说评级虚高、评级过度集中,97%的债券级别都集中在AA以上,这就使得整个债券市场的定价作用基本上丧失,对债券机构的投资者来说,外部评级的参考意义就很低。另外,特别是从2013年之后,整个互联网的信息发展变化非常之快,整个评级行业每年一次跟踪评级的情况,基本上也很难满足投资者在投资方面的需求。
在这种背景下,我们一直很想去做一些改变,思考如何能够更好的满足债券市场的投资者需求。直到2015年8月31日,国务院颁布了《促进大数据发展行动纲要》文件之后,我们从这份大数据纲要里看到了非常多国家层面在大数据产业的布局,看到了对评级行业能够带来很多变化的方面。所以,那个时候我就感觉到一种时机的到来,感觉到我们有机会可以去做点什么,所以我就在2016年成立了鹏元数据,初衷是想在未来的大数据时代下利用物联网、AI、区块链、云计算、大数据等技术,去构建一套我认为可以代表未来的一种先进的大数据信用风险评价体系,用这个体系来打造一家受市场尊敬的大数据智能风控服务机构,这是我当时出来创办鹏元数据的目的和初衷。
2016年我们成立鹏元数据之后,首先在付费模式上,我们利用技术的进步做了一个创新,也即采用SAAS平台,通过SAAS平台我们能够做到向投资者收费,所以就能保证鹏元数据能给出相对比较独立的观点和意见。讲到这里,我再补充一下,其实过去在20世纪70年代以前,美国三大评级机构标普、穆迪、惠誉评级的收费模式也是向投资者收费的,为什么到20世纪七八十年代之后,它整个收费模式就转向发行人收费呢?其实这也算是利用设备技术进步的一个结果。因为以前是通过卖报告的方式,用印刷的报告给到投资者,它是一份一份的卖,向买方收费。20世纪七八十年代之后,随着计算机和互联网的出现,信息在网上很容易被复制、传播,所以这就导致它们向投资者卖报告的方式行不通了,最后就慢慢转变成了向发行人收费的模式。
到今天,伴随设备和技术的进步,现在用大数据SAAS平台,我们可以做到实时的在线服务,这种服务模式就跟以前的报告不一样,以前的报告可能是写完以后半年、一年后再更新一次,投资者可以复制。现在通过SAAS平台可以实时的更新数据信息,所以通过线上服务的方式我们又可以回到以前,回到向投资者收费的模式,从而确保我们观点的独立性。这也是我们从创办公司到现在一直坚守的观念,而且我希望我们能够永远坚持下去,当我们在为投资者提供服务的时候,一定是不允许向发行人去收费,进而确保我们作为信用评级服务机构的独立性。
Q&A:
南方网记者:“it-SaiD它说”作为国内首个大数据债券风险预警平台,它有哪些亮点呢?您能否结合实际案例为我们讲述一下,它是如何有效的解决目前债券市场的风控难题呢?
张智英先生:我前面说到的收费模式,我认为它是一种很大的创新。但是对于投资者来说,它不认可这能够给他们带来什么帮助,如果从投资者的角度去看这个问题的话,我认为经过两年多的探索和努力,我们做了三个方面的创新,来帮助投资者解决信评行业相关的问题。
第一个创新是信息采集的方式。以前我们做信用评级的时候,大部分要靠研究员通过很多的渠道,比如说Wind、百度、各行业网站、资讯网站等去收集很多信息,现在“it-SaiD它说”通过大数据技术,就会帮大家去采集我们认为那些对企业信用评级影响很大的信息和数据。比如我们现在通过监测2万多家网站,每天获取将近5600多万条的信息录到我们的平台,投资者们就可以很方便地在上面找到他们可能需要的信息。
第二个创新是信息的处理。不知道大家有没有一个感受,从2013年移动互联网大面积应用以来,在现今整个资本市场上,出现了“过载式信息不对称”的现象——由于互联网、移动互联网、物联网的广泛应用导致的信息爆炸式增长和严重的网络信息过载,使得人们用人工的方法来排除信息垃圾、获取有价值的信息难度加大,由此造成的新的信息不对称。过去金融机构在解决市场上这种信息不对称问题的时候,解决的都是传统的信息不对称问题,也即我们大量的金融机构都是在做信息的加法,就如我刚才说的第一步,把信息收集过来再分析。未来金融机构更需要去做信息的减法,去萃取更有价值的信息,从而解决“过载式信息不对称”的问题。我们第二个方面的创新,就是通过NLP自然语言处理的方式去构建一个体系,帮助众多的投资者快速地把这些新闻、公告以及各方面的交易信息去阅读完入库。期间,我们做了很多的探索,比如我们建了十几万条的语料库,让机器去阅读我们的文章,构建50多万个的金融词典以及上百万级的企业关联图谱。通过这几方面工程化的实现,我们现在每天在“it-SaiD它说”平台上处理的债券市场数据,通过简单地换算,等于10400个小时/人天的工作量。这种创新,我认为对整个债券市场以及投资者在投资决策上会起到比较好的作用。
第三个创新是在模型方面。评级需要模型,以前我们的模型可能大多是用财务的数据来建模,所以我们那时做的模型基本上是通过十几、二十几个指标来搭建的模型框架。现在我们通过机器学习的方法,就可以把很多非结构化的文本信息通过结构化处理之后,把更多的定性化的数据能够模型化。从以前二、三十个指标扩展到现在一千多个指标,去对一个主体进行评价。另外,因为我们每天都对这些信息进行处理,相对来说会比较动态。无论是评级、信用分也好、结果也好,都是每天可以刷新的,所以这个方面的进步就克服了一年一评的评级结果滞后问题,一定程度上满足了投资者对信息快速获取的需要。市场上70%的主体在被降级或出现实质性违约之前,我们的大数据预警模型都发出了不同程度的预警信号。现在我们的目标就是未来能把我们的评级做成“T+0”,这样对投资者来说就再好不过了。
目前,鹏元数据以深圳总部为起点,业务辐射全国40+个大中城市。目前平台机构用户400多家,机构类型涵盖银行、保险、券商、公募基金、私募基金、资产管理公司、信托公司、评级机构以及监管机构等,平台已为湖南发改委、江苏发改委、广东发改委等债券监管机构提供实时全方位的企业债券信用风险管理和监控预警服务。
Q&A:
南方网记者:我们了解到鹏元数据目前主要致力于债券大数据智能风控,可谓是债券大数据智能风控垂直领域的佼佼者。不过据了解目前能发行债券的公司主体大都为大中型企业,数量仅有几千家,但市场还存在数以万计的中小企业,它们面临着更加严峻的融资难、融资贵难题,请问鹏元数据是否有考虑依托自身在债券大数据智能风控的成熟经验,来帮助投资机构制定中小企业的信评模型,进而来帮助或缓解中小企业融资问题呢?
张智英先生:这个问题比较大,而且确实影响面比我们债券市场还更加深远。但是问题非常好!我最早做评级,也是从中小企业评级开始,那时候在深圳开展借款企业评级,专门针对深圳借款500万元以上的企业每年评一次。为什么我们现在在探索大数据信用风险评价体系的时候没有从您刚才说的这个领域去切入,反而走的是债券这个领域?其实在我看来,目前用先进的技术去解决中小企业融资难的问题可能不是最合适的时机。打个比方,刚才说到的各种算法、工程方法其实就像是一个汽车的发动机,它有很先进的逻辑在里面,事实上这个模型是否有效,还需要很多数据的支持,就像刚才说的,每天需要采集很多数据,但是对中小企业来说,我认为它们目前应该还是处在过去那种传统的信息不对称模式,它还不是说信息过载,它大量的很重要的信息在设备上是没有的,是获取不到的。这就等于你一个汽车的发动机很好,但是你没有汽油,你想让它跑起来我认为比较困难。
也是基于这个原因,鹏元数据在中小企业、小微企业方面的探索,目前还没有实践地去付诸行动,但是我们后期会参与这块,从战略上和规划上我们是有计划的,未来条件一旦成熟,我们肯定会把我们现在构建起来的大数据信用风险评价体系应用到这个领域来,我相信是没有什么问题的,所以我们在战略规划方面都有相应的安排。我们现在在这方面也在跟各方进行探索,条件成熟的话可能要等到物联网在工业界全面应用之后,那个时候,我相信去解决刚才您说的中小企业融资难、融资贵方面的问题会有比较好的办法。
Q&A:
南方网记者追问:既然鹏元数据目前有着手这一块,且也做着相关的技术和数据方面的积累,请问张总现在是否可以和大家具体的说一下呢?
张智英先生:其实刚才说了,我们现在更多的还是处于一个战略布局和规划阶段,具体的实施细节我们现在还在探索过程中,这时候也不方便去透露更多,等平台建设到像“it-SaiD它说”这样成熟时,我们一定会向社会发布,大家拭目以待!也希望媒体和其他业界朋友能够关注我们在这个领域的行动!
Q&A:
南方网记者:无信用,不生活!中小企业融资难、融资贵,其核心还是凸显出整个社会缺乏完善、科学的信用评价体系。无论是从国家意志、政府机构,还是我们社会媒体,大家都在致力于推进整个社会信用体系建设;据了解,鹏元数据也是信用领域建设的一员,请问张总在助力信用体系建设这一块,您这边有哪些建议呢?鹏元数据目前关于诚信建设工作的进展如何呢?
张智英先生:这个问题更大,这是一个很大的社会问题。从我本人角度来说,我非常热衷从事社会信用体系建设的工作,我也跟我的同事们灌输我们是金融科技时代下社会信用建设者的理念,为什么这么说呢?现在整个社会,不管是国家还是政府都非常重视社会信用体系的建设。包括我自己在信用这个领域也做了十几年,所以也希望我们整体社会的信用越来越好,比如南方报业传媒集团要推出南方信用研究院,我认为这就是非常好的一个范例,很有前瞻性,也非常有社会意义。如果说鹏元数据能有幸作为其中一员,一起去参与建设的话,我们肯定也很乐意的,我们会贡献我们所有的力量去把这个事情做好,毕竟这项工作社会意义很大!
虽然鹏元数据成立时间还不长,只有两三年的时间,但是我们一直在努力去做这方面的建设工作。比如说,我们当时在建设厦门大学大数据信用评级实验室的时候,其实也是怀着这个目的去做的。按理说,我们公司还刚起步,没有这么大的能力去做这么大的一个信用评级实验室,但是厦门大学想将大数据技术应用到金融领域,想怎么去做理论创新,而我们在做实践的探索,思考如何在未来大数据的时代下,怎么用大数据的技术去更好地解决“过载式信息不对称”的问题。所以我们就一起建了这个信用评级实验室,经过一年的发展,我们做了很多的东西,到明年年初,会有一系列的理论跟实践的成果出来,这就是我们现在在社会信用体系建设的一个探索。
第二个方面的探索,我们跟广东省信用协会在今年1月份进行合作。广东省有很多商协会,商协会里面有很多会员企业,我们鹏元数据贡献我们的技术力量,在广东省信用协会的牵头下,我们构建一个行业信用信息共享平台,这个平台按照我们现在的定位也是属于公益的,所有的企业都可以上来分享信息和数据,包括我们的会员单位的企业都可以在上面去分享它的数据,这是一个民间的组织,这就更加带有社会信用体系建设的味道。
总的来说,鹏元数据希望能够成为在未来大数据、金融科技时代下的社会信用建设者的一员,共同推动中国诚信文化的传播以及整个社会信用体系的建设,最终实现“让数据成就信用和生活”的远大目标。