技术学习大数据 爬虫Python AI Sql

人工智能在金融风控领域的应用

2017-03-21  本文已影响719人  点融黑帮

在上周三的极牛技术分享活动里,我做了一场 topic 是《 AI in Dianrong Risk》的分享。主要介绍了一些我们关注的人工智能技术可能在哪些方面会对金融行业带来一些变革,以及在点融我们是怎么将人工智能技术应用于风险控制的。

互联网上有这样一个关于 AI 的定义:

AI is the science and engineering of making intelligent machines and computer programs capable of learning and problem solving in ways that normally require human intelligence.

AI 是运用智能硬件和计算机程序,解决在一般情况下需要人脑解决的问题的科学技术。

传统金融如何利用数据?

所谓前事不忘后事之师,在了解  AI 对传统金融行业带来的影响之前,我们可以借鉴以往的经验,看看传统金融行业对现有数据的利用情况。

在过去的几十年甚至百十年中,无数的银行家,金融工程师,数据分析师,金融从业者为我们设计了很多非常便利方便的金融产品,比如信用卡业务,个人贷款业务,在这些产品迭代的过程中他们形成了非常严谨的迭代和风险控制的方案。

他们所利用数据的特点是针对这些金融产品业务区分能力强,但是覆盖人群相对较低。

就如上图所示的冰山,传统金融行业对数据的利用率只有10%左右,而 Fintech 公司需要做的就是挖掘那些隐藏在冰山之下的数据,把金融产品带给更广泛的人群。

互联网金融怎么做?

随着大数据解决方案的普及,我们可以搜集更多维度的数据来更精细的进行用户画像,包括利用一些行业数据,用户的互联网浏览数据,司法执行数据,第三方信用数据,出行数据,电商平台的交易数据,电话通讯数据和社交数据。这些数据的覆盖人群会远远超过现有的金融行业所使用的数据。

而 AI  就是对这些数据进行组合,从而挖掘出有效的特征。

如何利用好这些维度很高的数据,需要一个智能的解决方案。因为这些数据大多是非结构化的数据,可能来自邮件、视频、文本、语音、点击浏览行为、社交网络等多种渠道。数据的量级和清洗是一个重要的环节。

而大数据的一些解决方案为我们提供了较好的基础设施。

关于 AI

在此之上人工智能可以带给我们大量的自动的规则学习,同时带给我们更加强大的表达能力,而不仅仅是一些线性模型。当我们加入更多数据的时候,关于人的描述已经上升到更高维度的空间中,这时,我们就需要表达能力更强的模型,比如 GBDT 的模型,有几千个有权重的子树,比如深度学习网络,多层的神经元通过加工,自动抽取最优组合。

一个传统的贷款业务可能需要2-3天来审批,而一个基于人工智能模型的自动审批方案可能只需要几秒钟就可以完成。同时有些传统风控模型的迭代周期可能要数个月甚至数年,但是人工智能的模型迭代可以非常便捷和自动。

AI 所做的就是极大简化这个过程,提高效率,同时可以大大提高模型验证和迭代的速度。

AI in Dianrong

在点融,我们应用于风控的人工智能解决方案主要有以下三个部分:

数据搜集和处理

风险控制和预测模型

信用评级和风险定价

便利可扩展的数据存储和处理方案是重要的基础架构。

各种非结构化数据到结构化数据的灵活转换是保证应用的重要一环。

欺诈的识别是风险控制的第一步,如果利用第三方数据高准确度地识别一些有欺诈嫌疑的用户是这一个环节需要解决的问题。

灵活地支持人工智能的风控引擎和规则引擎是保证人工智能应用的业务的重要工具。点融的规则引擎同时可以支持简单的条件规则、也可以支持决策树的规则,以及更加复杂的 GBDT 和深度神经网络模型。

通过知识图谱我们可以将人群的关系更直接地映射到图数据里,通过这些关系的远近、和异常拓扑结构的识别,我们可以发现更多更深层次的风险模式,通过识别这些模式可以有效地减少团伙欺诈。

在风险级别识别和风险定价的模块里。我们会结合三类打分板:专家打分板,传统的逻辑回归打分板以及人工智能打分板在不同场景下针对用户进行不同级别的人群划分。针对不同级别的人群和不同产品的需求我们会试算出针对于该风险人群的定价。

我们点融也在积极地将人工智能模型作为主要风控手段迭代改进自己的系统中。

同时我们也在应用深度学习解决一些业务冷启动的问题。利用 transfer learning我们可以大大加快模型在新业务数据不足的情况下收敛的速度。

总结

最后引用薛贵荣博士的博客中一段话:

“基于实例的迁移学习的基本思想是,尽管辅助训练数据和源训练数据或多或少会有些不同,但是辅助训练数据中应该还是会存在一部分比较适合用来训练一个有效的分类模型,并且适应测试数据。于是,我们的目标就是从辅助训练数据中找出那些适合测试数据的实例,并将这些实例迁移到源训练数据的学习中去。”

如何应用深度学习挖掘一些特殊的特征,比如知识图谱中基于拓扑结构的特征也是我们在积极探索的一些内容。

本文作者:单忆南Sync(点融黑帮), 点融网数据负责人,曾就职于国内、国际大型互联网公司,并从事搜索引擎,搜索广告和电商垂直搜索的研发工作。2015年加入点融,参与组建数据团队,根据公司业务情况建立了从数据仓库、BI、数据挖掘到自主研发的风控引擎的设计和实施。

上一篇下一篇

猜你喜欢

热点阅读