不会编程的精算师不是好数据科学家
之前在纽约求学和工作的时候,身旁经常出入一些正在路上努力以及已经考出来的精算师朋友们,大家不约而同地都在追逐同一个梦想:一份余生稳定且收入颇丰的工作。
几日前,一位本科正在读精算专业的同学问我,“毕业后我能做数据科学家吗?”
这个问题问得好。咱们坐下来一起,把精算和数据科学到底是怎么一回事儿,好好聊聊。
什么是精算科学 (Actuarial Science)?
精算科学的根源可以追溯到17世纪初,Richard Witt发表复利概念的时候,其被公认是最早的精算师。精算师,尤其在承保贷款和早期保险方面,是数据最早一批的使用者(并从中获取信息)。
精算师专门评估风险和不确定性对财务带来的影响,同时设计解决方案,以减少任何未来风险和发生任何不良事件的机会。
Richard Witt在1613年发表的Arithmeticall Questions,这是第一本关于复利的教科书,其中包含关于复合利益在17世纪英格兰的贷方,土地所有者和商人的实际应用的表格和公式。
精算师是干什么的?
精算师是训练有素的专业人士,负责分析财务数据以确定和量化风险、概率和不确定性。通过运用统计学、数学和金融理论,创建表格、报告和图表来解释提案和计算,精算师能够评估和预测潜在环境或事件的风险。精算师可以在不同行业工作,但最常见的是保险公司。
精算师使用不同类型的数据,设计和测试保险政策,以确定风险因素,从而了解应为最低风险和最大盈利能力收取多少保费。虽然一个人可以本科毕业成为具有学士学位的精算师,但美国劳工统计局表示,获得副学士级的精算师认证需要四到七年,而获得最终精算师的资格需要再多加两到三年的时间。
什么是数据科学(Data Science)?
简言之,数据科学是将科学方法应用于商业数据,得出结论从而指导行动。数据科学包括技术工具和统计方法,目标是为组织中的管理者提供信息,并从中获取洞察力,帮助他们在问题变得太大而无法处理之前解决问题,做出决策和风险管理。
在第二次世界大战之后,在产学研各方面的协同努力下,现代数据科学实现了飞速发展。2000年后的一大批互联网企业崛起,给数据科学领域带来了革命性的巨变。
现代数据科学领域发展之路上的那些里程碑们数据科学家是干什么的?
数据科学家,通过使用可以从数据中获取信息的工具,深入分析和了解数据,建立预测模型并分析结果。他们具有良好的逻辑性,并且在相关的数学统计概念方面具备扎实的基础知识。
一名优秀的数据科学家,不仅擅长编程和数学,而且还具有出色的沟通技巧,可以清晰准确地传递数据的使用和结果的含义。同时,需要理解和交流客户的潜在需求和挑战,并传达模型的含义与分析结果,而不是仅仅关注数学统计算法的细节。
技术背景与常用工具
虽然精算师和数据科学家都是在对未来的结果进行预测,但他们实现这一壮举的方法却是不同的。资产充足性分析、基本链和阶梯法、利润测试等技术更专注于精算专业,而数据挖掘和机器学习是任何数据科学专业人员的基础。
精算师通常使用SAS, Excel, VBA和SQL,并且还具备行业特定软件的其它知识,例如ResQ,用于保险和先知的一般保险,以及人工保险的精算建模。数据科学家更精通编程,在日常工作中需要更多的编程,包括C++, R, Python, Hadoop等。
一张图看懂两者的定位
精算师主要关注的是财务问题,在其它更广泛的业务方面 (比如市场营销) 经验较少。数据科学家则要去了解数据对所有业务部门的影响。
精算师的工作是通过长期且深入的专业培训和标准化的分析手段来推动的,而数据科学家则专注于通过各种方法获得预测结果。
精算师主要是保险行业结构化数据的方面专家,而数据科学家对大多数组织的最大价值在于他们能够有效地处理大量非结构化数据。
精算师通常采用的是一些相对成熟的标准化系统工具和软件,而数据科学家则需要致力于长期研发各种算法和工具。
我个人推崇的一位数据科学领域的KOL - Drew Conway,其早年对数据科学(以及精算科学)的定位是非常清晰准确的,具体概括总结如下图。
一句话总结:不会编程的精算师不是好的数据科学家。
Drew Conway通过可视化手段对AS & DS准确的定位精算师应该转行做数据科学吗?
第一次遇到学生在问这个问题的时候,我不仅在想:这完全没有一个清晰的非黑即白的答案,应该看个人兴趣爱好再定。
但琢磨了几日后我想,如果从经济收入、职业名望、职业安全稳定性,这一相对简单的角度来看,也许我们可以通过数字得出一些初步结论和建议。
Michael Stefan,在金融保险行业从事猎头工作,其2016年的一篇文章《I'm an actuary - should I be a data scientist?》,通过分析全球这两种不同职业的供与需两侧不同的数据,得出了如下的结论:
“在美国,每一个‘数据科学家’招聘广告背后会有54个申请应聘者,如果你是精算师,那么在美国每个职位有9个潜在竞争者。”
“所以,如果我被问到 - 我是精算师,我应该成为一名数据科学家吗?我可能会建议“不”,至少从高层次的行业的角度来看。在其他条件相同的情况下,我会远离竞争,更快地让我拥有更高的知名度。”
我对Michael的分析结论补充一点。其实社会上有相当数量的学生(初级)精算师,但由于考试难度和课程的长度和广度的要求,职场端高级精算师需求的数量则要远超真正合格的精算师的数量。
数据科学是一个跨多学科领域,要求专业人员拥有各种技能,现阶段,真正合格的数据科学家,其实数量相比需求要少得多,未来一段时间的职位需求缺口还是会很大。
PwC在2018年3月发布的一份题为《How do actuarial and data science skills converge at life insurers?》报告,对精算师如何面对未来更好的准备自己,从而更好的胜任来自数据科学领域的挑战,其内容对业内朋友会有一些启发。精算科学和数据科学,在行业需求和供应方面,对各个专业的人员都带来了巨大挑战。
最后与大家分享一句话,聊以共勉:
“Always go with the choice that scares you most, because that's the one that is going to help you grow.”
每日清晨在船上远眺S.F. Dwtn