蚂蚁金服崔恒斌:金融智能——对话机器人新形态
文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。
转自 | 中国人工智能学会
本篇整理自蚂蚁金服人工智能部高级算法专家崔恒斌主题为《金融智能——对话机器人新形态》的精彩演讲。
崔恒斌
蚂蚁金服人工智能部高级算法专家
以下内容根据速记进行整理
经过崔恒斌本人校对
2015年蚂蚁金服开始着手构建智能服务的能力,当时叫做服务宝。经过3年多的沉淀,不仅支持了蚂蚁内部业务,同时也以金融科技服务的形式输出给我们的生态公司、合作伙伴。与此同时,根据业务诉求、场景以及服务中不同的角色定位,还研究推出了不同形态的机器人,比如语音交互机器人、对话助手机器人、外呼机器人、群服务机器人等。在报告标题前我特地加上“金融智能”,有三个原因:
① 我们服务的行业有所侧重,更加关注金融行业的服务诉求,比如银行、证券、保险和基金等;
② 与集团的整体战略相关,蚂蚁金服定位是一家技术服务公司,即TechFin战略,用技术重塑金融,智能的服务技术是其中重要的组成部分;
③ 2017年阿里巴巴成立了达摩院,其中有一个分支是金融科技,这部分是蚂蚁金服人工智能部来承担的,其中就包括了智能机器人的相关技术。
蚂蚁金服
蚂蚁金服很多人可能不熟悉,但说起支付宝大家应该比较有亲切感。现在移动支付、网购、共享单车和高铁并称为中国新四大发明,其在人们日常生活中的地位不言而喻。看病不需要排队,可以通过支付宝挂号缴费;缴费可以不出门,通过支付宝的城市服务可以完成各种生活费用的缴纳;借阅不办卡、出国简化申请流程、打车不着急、旅行不带钱等,支付宝已经遍及人们生活的方方面面、角角落落,也给人们生活带来了极大的便利。这里有一组数字:在杭州有超过100项的城市服务、98%的出租车支付、超过22000家的餐饮店付款都是通过支付宝完成的,一年内浙江有6亿多人次享受过支付宝带来的城市服务。杭州作为新型智慧城市标杆,同时也是互联网城市的代表,移动支付在其中发挥的作用不可替代。
除了支付宝以外,蚂蚁金服还有其他的多款产品。网商银行、蚂蚁财富、芝麻信用和蚂蚁保险,在集团内部并称蚂蚁的“四小龙”。网商银行主要的业务是花呗、借呗和中小企业贷;蚂蚁财富主要的产品是余额宝、基金、证券等;芝麻信用,就是大家熟知是芝麻分,可以通过芝麻分进行信用租、信用住、信用贷;蚂蚁保险作为保险平台,为大众提供了多种健康、意外、人寿、旅游险种,包括最近非常出名的相互宝。除此之外还有蚂蚁森林、蚂蚁庄园等公益项目。通过这些业务实践和产品打磨,已经形成了以BASIC(Blockchain、AI、Security、IoT、Computing)为基石的全栈式金融科技服务。
在国内有支付宝、城市服务等,在国外,目前,蚂蚁金服已覆盖东南亚9个地区和国家,包括中国香港、印度、泰国、马来西亚等。前段时间去欧洲参加EMNLP,发现不能用支付宝是非常痛苦的一件事情。不过好消息是,支付宝已经与欧足联达成合作伙伴关系,相信在不久的将来欧洲也可以使用支付宝和各种支付服务。
蚂蚁金服的人工智能部在集团中主要有三个职责,
第一,把人工智能技术应用到蚂蚁所有业务上去;
第二,要承担人工智能布道师的角色,为各个业务部门培养或输送人工智能的人才,让AI技术更加深入业务;
第三,算法前沿的跟踪和算法创新。
目前人工智能技术已经在蚂蚁金服的多个业务线落地生根,比如微贷准入模型、智能营销,安全的反洗钱、反作弊、反欺诈、账户安全模型等,智能客服的智能问答、舆情分析,财富的理财顾问机器人、精准营销,芝麻信用的用户画像、信用评估,保险的风险评测、图像定损等。
对话机器人
人工智能对于对话机器人意味着什么?根据我们在智能服务机器人的探索,总结了如下图所示的四个层次。
第一, 猜你问题,即当用户还没有描述问题、还没开始提问时,能不能给一个很好的提示或者解决方案。如果用户能非常直接地看到自己求助的问题并获取到有效的解决方案,这对用户是非常友好的,同时也减轻了后续服务链路的压力。当然,如果用户没有获得想要的答案,在用户输入问题时,还可以给其提供渐进提示的帮助,减少用户输入和语言组织的成本。
第二, 自助服务,通过搭建智能服务机器人来准确用户的意图,并能提供精准答案,即便无法提供准确的解决方案,还可以根据识别的结果进行排单,找到合适的技能组、合适的小二来解决用户的问题。
第三, 进入到人工,通过智能的方法去提升服务的标准化,提高服务效率和用户求助体验,从而提升用户在人工求助的解决率或成交率,这时就可以有一个给小二用的对话助手机器人。
第四, 主动服务,就是当发现用户在产品使用过程中遇到障碍时,主动发起服务介入,或者用户问题需要更多后续链路才能得以解决时,可以及时地跟进进度,给用户主动的进度告知和服务跟进。
基于这样的思考,探索了如下几种形态的机器人:
语音交互机器人,其中包括了猜你问题和自助语音交互;
对话助手机器人,用户求助进入人工,帮助服务人员提高服务效率和服务质量;
智能外呼机器人,即主动服务。
语音交互机器人
经过2017年一年的努力,我们把蚂蚁金服的语音机器人做成业界标杆。业务上,创造性地在语音端引入未问先答的能力,这是行业首创,与在线不一样的地方在于,语音场景客户看不到,唯一的交互方式就是语音,这就要求模型输出有较高的精度,把最准、最置信的识别结果输出给用户,而在线场景可以给用户展现任意大小的列表;
其次,效果非常好,比如未问先答,日常可以覆盖超过三分之一的进线服务量,准确率超过70%,“双十一”期间,这一覆盖率达到40%以上。整个语音交互过程,也可以覆盖70%的用户来电,其中超过70%用户可以被识别准确,加上后续的渠道分流的比例,整个渠道有近三分之一的用户求助不需要人工干涉就可以解决。这意味着什么?可以粗略算一笔账,蚂蚁金服热线每天的进线量在20万左右,假设每个服务小二平均每天的接线量是100通,这里可以节约超过600的人力成本,这对服务来说是非常大的一笔费用;口碑上得到了用户非常真切的点赞。
回到语音交互机器人本身,做法上与自助机器人有哪些不同,是不是可以直接复用自助机器人的技术?这里我主要列举四点不同。
第一,渠道目标不同。在业务设计中,IVR以识别用户意图为首要目标;而自助机器人,我们希望尽可能给用户提供准确答案。语音场景下,无法给用户播报长篇大论的答案,比较好的方式就是把答案信息通过app或者手机短信的方式推送给用户。
第二,交互形式不同。热线端,我们唯一的交互手段就是语音,所以凡是语音交互遇到的一系列问题,在IVR中都会出现,比如啰嗦口语化的表述、语音转文本的错误、长文本等;在线端,交互的方式就多种多样了,除了文字交互外,还可以点击、发送语音、发送图片等,形式丰富多样。
第三,带入信息不同。热线端,来电一般是移动手机或者固定电话,信息是非常有限的,来电号码能不能对应到用户的账户信息,是我们必须解决的问题;而自助端,天然的账户体系,可以带入账户下的任何信息,包括因子、行为轨迹和可能的业务数据等。
第四,多轮交互心智不同。在线端,我们习惯了通过IM进行多轮的沟通,但在热线端,特别跟一个语音交互机器人,进行很多轮的交互对话是不现实的,业务上做过一次调研,用户在IVR中交互可以接受的轮数不超过3轮。
基于这样的差异,设计如下图所示的业务和算法流程。
下面将逐一讲解一下这里的猜问题、问题识别和三要素反问技术。
首先猜你问题,这里举了一个真实的例子,从用户的言语间,不难觉察用户的惊讶和惊喜。那么未卜先知是怎么做到的?核心是这样一个数据模型的闭环。
数据,我们根据用户账户信息中提供的行为轨迹、精准因子和历史求助文本,这里的数据体现了某种程度上的多模态,有文本型、时间序列型、离散特征等;
模型,主要是神经网络的深度模型;
输出,我们会根据模型输出的内容和分值,提供给用户最有置信度的问题进行确认;
反馈,非常重要,也是热线场景非常有特色的地方,这里的反馈是用户非常明确的是和否的反馈,是我们模型优化和迭代重要的监督数据。基于这样的闭环体系,可以构建出热线场景高覆盖高精度的猜你问题技术。
具体到模型,针对我们的数据特点,提出了混合网络的模型结构,即通过卷积神经网络和LSTM处理用户文本特征,通过LSTM来处理用户的行为轨迹和服务轨迹,精准因子通过两层的DNN来处理,最终将各部分处理的结果concat一起,来实现问题的分类。模型思路很简单,但效果非常好。混合网络模型,除了应用于猜你问题和问题识别,还广泛应用到了要素识别和智能派单,细节上就不再赘述了。
如何做多轮交互?常见的多轮对话,称之为任务型的多轮对话,如订机票、询天气等,通常的处理技术是slot filling。对于服务型的场景,比如用户说了“蚂蚁借呗”,意图并不明确,我们如何进行交互?所以,我们面对的挑战是,用户意图不明确,没有固定的槽位信息:服务问题以及知识库的多样化;这类问题还没有统一的框架,一般以规则配置为主。
结合业务场景,我们创造性提出了业务、框架和类型三要素的统一框架:
业务就是我们的产品和业务场景,比如花呗、借呗、余额宝等;
框架,一般认为是句子中的核心动词和短语等,比如还款、转账到银行卡等;
类型,种类非常有限,一般指问题类型,比如如何操作、什么原因、操作失败等。
这里给了一个示例,见下图。我们利用用户相关的文本、行为轨迹和因子数据作为特征,通过multi-task的模型来识别要素,比如这里,识别到了用户咨询的业务是花呗、框架是还款,但类型是不知道的,这时判断三要素有缺失,就发起了这样的反问问句,希望用户能给出进一步的信息输入和确认。需要补充说明的是,该框架还具有zero-shot的问题识别能力。
对话助手机器人
用户真正进入人工渠道,这时机器人还能做什么?需要一个辅助的机器人来帮助我们的服务小二,提高服务效率,降低服务成本。以往人工服务时,小二服务用户靠的是自己的积累、便签和记录,需要在服务过程中去查询和回忆各种需要的内容,而对话助手提供的能力,正如导航提供的能力一样,给用户提供实时的内容提示、产品推荐和话术提示,给服务者或者销售人员提供了对话的导航能力。
我们会实时监听用户和服务、销售或BD的对话内容,并进行实时分析,根据底层提供的知识库、用户画像和优秀话术等,实时给用户提供销售话术、用户问题的答案、产品推荐和相关预估等,这在一定程度上,降低了服务或销售的门槛,提升平均的服务或销售水平和服务效率,从而提升用户的满意度或者换化率。
内容上,怎么进行有效的生产?我们构建了一套完整的话术生产体系:从人工服务对话记录中,同时结合助手使用的报表,通过语料筛选、问题聚类、问答生产和答案推荐手段,将高质量知识点、问答对、话术等收纳到话术库中;同时也提供了给运营专家的运营能力;另外,服务小二也可以自定义自己的话术库。对话助手依赖自动挖掘的话术库、运营专家录入的话术库和小二自定义的话术库,可以实时提供相关内容的推荐。其优点是:
①挖掘内容基本上都是非常完整的问题答案,结合了小二本身的一些特性,可以使得该内容非常优质;
②整个内容体系可以形成有效的更新迭代,根据小二的使用情况,及时丰富重要的内容,淘汰很少被使用或者被采纳的内容;
③ 这是一个小二智慧吸收优化迭代的过程,通过这种方式的内容更新,可以极大程度的丰富我们的知识体系和内容质量,以此来实现服务或销售水平的整体提高。的确如此,将该技术输出应用到我们的保险平台租户,帮助租户提升售前服务能力,在最终转化上可以获得超过10%的提升。
智能外呼机器人
智能外呼机器人有非常多的应用场景,可以应用于金融、房地产、互联网广告、保险、教育、电商、汽车、快递等多个行业中。一般外呼的需求有这样三个特点,
一是海量的呼出需求,即呼出量需求本身非常庞大,以蚂蚁金服自身为例,某个业务每月的呼出量是百万级,这样大量的输出通过人工很难做到;
二是内容和流程相对固定,即某一个固定流程去走、按照相对固定的话术内容和用户进行交互,具有较好的可复制性;
三是缩小用户集合,为后续的服务、销售打好前哨,这样可以让人工或者有经验的销售很快介入,进行针对性的服务和引导。
基于此,我们在蚂蚁内部也做了简单的尝试,配置了如图所示的交互流程。其中核心的技术是意图匹配和意图分类算法,小样本学习方法在其中发挥着重要作用。
下面给出一个真实催收的对话记录。
机器人:你好,我是蚂蚁花呗。你的花呗已经逾期了,请问你今天可以花款吗?
用户:还不了,今天还不了,没有钱!
机器人:你的欠款已经逾期,会影响你的个人信用,你要几天能还清呢?
用户:能不能给我分个分期做个一年啊
机器人:你的欠款已经逾期多天,会影响个人信用,请你务必在三天内结清欠款。如对欠款有疑议,请登录支付宝或致电95188查询。谢谢,再见。
整个对话过程看似简单,但这样的系统确实起到了很大作用,不仅节约人力成本和支撑大量的呼出需求,而且对于业务本身也有很大的帮助。以花呗逾期3~15客群为例,智能外呼机器人相比传统的语音播报,可以相对提升出催率50%,这样就减少了每月新增催收成本3%,效果还是非常显著的。
当然,未来我们还将进一步优化系统效果,扩大呼出的覆盖量,同时提升交互体验,包括系统端的可打断功能、算法端更加自然流畅的多轮交互能力和语义理解能力。
钉钉服务群机器人
钉钉作为企业沟通协同平台的龙头老大,目前已覆盖国内超过700万的中小企业,注册用户数超过1亿,很多企业通过钉钉进行外部客户的服务,比如提供售前咨询、售后服务和业务咨询等;同时也有很多企业通过钉钉完成内部员工的服务,包括人事制度的咨询、IT问题、财务行政等,咨询的方式包括一对一咨询和群聊咨询。
而蚂蚁智能云客服可以提供全链路、完整的智能服务解决方案,包括智能知识库、自助机器人、在线人工、热线IVR、热线人工、工单等。
2018年年初,我们跟钉钉一起启动了双剑合璧的项目,旨在联合钉钉一起为企业办公打造便携式的智能服务,主要覆盖两大场景:
单聊,即在钉钉中可以检索到企业对应的机器人,直接咨询,大部分问题都可以得到快速的响应和解答,如果机器人解答不了,会转到相应的人工进行作答。
另一种是服务群,应用较多的是企业服务和商家自身ToB的服务,主要的场景是,客户直接在群里提问,服务群机器人会自动识别用户问题,并根据用户的问题内容及时提醒并分配给相应的服务或销售人员;同时在服务和销售人员答疑过程中,提供相应的答案辅助功能。下图展示了我们服务群机器人目前提供的一些功能,可以极大程度地提高企业的服务效率和服务质量。
总结
结合蚂蚁金服的场景,我们构造了多种形态的机器人,包括语音交互机器人、对话助手机器人、智能外呼机器人和钉钉服务群机器人,还有以前我们介绍得很多的蚂蚁金服的“我的客服”自助服务机器人。对话机器人这些形态的出现,给业务带来了很大的便利和帮助,主要表现在:让服务数字化、透明化。可以完成简单重复的工作和服务的标准化。完成海量的服务诉求。提升效率,沉淀人工智慧。