量化文章1--量化投资——从西蒙斯谈起
2017-05-26 本文已影响127人
慢牛策略
讲起量化投资,就不得不提华尔街的传奇人物——詹姆斯·西蒙斯(James Simons)。
这位慧眼独具的投资巨擘,有着一份足以支撑其赫赫名声的光鲜履历:20岁时获得学士学位;23岁时在加州大学伯克利分校博士毕业;24岁时成为哈佛大学数学系最年轻的教授;37岁时与中国数学家陈省身联合发表了著名论文《典型群和几何不变式》,并开创了著名的陈—西蒙斯理论;40岁时运用基本面分析法设立了自己的私人投资基金;43岁时与普林斯顿大学数学家勒费尔(Henry Laufer)重新开发了交易策略并由此从基本面分析转向数量分析;45岁时正式成立了文艺复兴科技公司,最终笑傲江湖,成为勇执牛耳的投资霸主。
中国社会
“辱华”演讲呈现出的中国舆论场刘远举:在柴静的《穹顶之下》中,他们只批评数据的某处误差;在杨舒平的演讲中,他们假装只看到了演讲修辞的夸大。
这段看似青云直上的成名之路,再次为世人印证了一个道理——当代的技术创新,其实大多源自跨越学科的资源整合,而非从无到有的发明创造。具体说来,即使睿智如西蒙斯,在最初之时,他也没有直接想到运用量化方法投资,而是和众多投资者一样着眼于外汇市场,但野心勃勃的西蒙斯并不甘于只是简单因循传统的投资策略。随着经验的不断累积,他开始思考,为何不运用他最为熟悉的数学方法来搭建投资模型,从而能够科学精准地预测货币市场的走势变动?这一大胆的跨学科尝试,最终彻底改变了他的人生走向。
通过将数学理论巧妙融合到投资的实战之中,西蒙斯从一个天资卓越的数学家摇身一变,成为了投资界中首屈一指的“模型先生”。由其运作的大奖章基金(Medallion)在1989-2009的二十年间,平均年收益率为35%,若算上44%的收益提成,则该基金实际的年化收益率可高达60%,比同期标普500指数年均回报率高出20多个百分点,即使相较金融大鳄索罗斯和股神巴菲特的操盘表现,也要遥遥领先十几个百分点。最为难能可贵的是,纵然是在次贷危机全面爆发的2008年,该基金的投资回报率仍可稳稳保持在80%左右的惊人水准。西蒙斯通过将数学模型和投资策略相结合,逐步走上神坛,开创了由他扛旗的量化时代,他的骤富神话更让世人对于量化投资有了最为直观而浅显的认识:这能赚钱,而且能赚很多钱。
“文艺复兴”的能否真的“复兴”?
但金融行业瞬息万变,老天也没有一味垂青这位叱咤风云的“模型先生”。 自2012年以来,由西蒙斯掌印的文艺复兴科技公司可谓祸事不断,厄运缠身。其麾下的“文艺复兴机构期货基金”(RIFF)在2011年仅实现盈利率增长1.84%,到2012年,更是破天荒的亏损了3.17%,这一亏损幅度甚至超过了同年巴克莱CTA指数的平均降幅(1.59%)。RIFF主要通过全球范围的期货和远期交易来实现绝对收益,虽属于文艺复兴公司旗下规模较小的基金产品,但作为公司的明星”印钞机“,其回报率竟会一下暴跌至行业平均水平,难免让众人始料不及。到2012年底,RIFF 的资产规模已缩减至7.88亿美元,远远低于2011年的40亿美元。到今年10月底,文艺复兴公司最终宣布正式关闭 RIFF,一代“文艺”明星RIFF就此戛然陨落。
揭开”量化投资“的神秘面纱
量化投资在一定程度上已经被别有用心地神话或者说标签化了,就像当下风头正劲的“互联网金融”一样,很多时候都被包装成了看似“高端大气”、且可能“一夜暴富”的卖点或者噱头。追根溯源,其实量化就是指运用数学或者统计模型来模拟金融市场的未来走向,从而预估金融产品的潜在收益。在前文中,我们还曾提到多个数字,如平均年收益率、年回报率、年盈利率,这些其实都表征同一个量化指标,即“年化收益率”。它是指投资者在一年的投资期限内所能获得收益比例,专门用于评估投资行为或金融产品的好坏优劣。 那么,究竟多高的年化收益率才能给投资者带来丰厚的投资回报?为了更加清楚的分析这个问题,我们不妨举个例子。
比如某位名叫“G”的投资者,在1990年时持有3.8万的启动资金,如果其所认购产品的平均年化收益率是60%,那么经过25年,到2015年,“G”将会拥有40亿,但如果其所购产品的平均年化收益率上涨15%(到75%),那么25年后,“G”的资产将会是40亿后再加个零,变成400个亿。百亿身价竟仅仅始于3.8万?这种堪比原子弹爆炸的财富增长若仅仅用“回报丰厚”来形容,会不会未免有些太吝啬了?我并不十分相信那些投行精英们会如此慷慨无私,让投资者只需在家坐着就能稳收百亿回报,所以如果今后有人向我推荐金融产品,而且宣称年化收益率可以有60%,我肯定得思量思量,自己是不是真的运气那么好,这辈子可以被钱砸晕?毕竟像文艺复兴公司的传奇也像“文艺复兴”一样,虽然能被历史铭记,但却难以被时代复制。
得“量化”者得天下
虽然“量化”看似主要在投资领域大放异彩,但其触角实际已彻底覆盖了金融领域的各个命脉。在作者看来,金融业的整个运作流程,归根结底,就是“把适量的钱投到适合的位置,从而以适度的金额购买适当的产品”(“Put the ‘RIGHT’ money in the ‘RIGHT’ place with the ‘RIGHT’ amount for the ’RIGHT’ price“)。但是究竟多少算是适量?也就是所谓的”RIGHT“? 难道万事一拍脑袋,全凭感觉?还是仰仗捕风捉影、真假难辨的小道消息?这些显然都太不靠谱。
投资不是赌博而是博弈,理性的投资者应该学会运用投资策略来实现自己的财富增值。那么该如何将模糊抽象的策略变成具体可信的数字?
这其实就是“量化”在做的事情,即把投资策略通过数学模型和计算机代码数量化,让投资者可以基于数据分析和动态模拟而合理预测其投资行为的未来走势。投资者可以通过屏幕上显示的风险讲话指标,轻击鼠标生成定价模型结果或者是交易策略,根据实际情况略微修改参数,最终实现自己的资产配置及投资组合。无怪乎许多人都笑称,如今的伦敦金丝雀码头其实早已不再是全球的金融腹地,而是摇身变成了 IT 公司集散地。包括摩根大通、花旗以及瑞士信贷等在内众多欧美顶尖投行,都在不计血本的培养自己的 IT 团队,并命其专门从事产品模型研发,从而有力跻身到“得模型者得天下”的金融大战之中。 这些拥有专属开发任务的 IT团队也往往被称为量化团队,即 Quant Team,是买方或卖方机构中专门从事量化投资分析以及衍生品定价策略的肱骨砥柱。
除了金融市场的参与者都欲借“量化技术”的东风大展拳脚,众多欧美金融监管机构也针对金融技术的兴起而顺势推出了相关监管政策。英国《金融时报》欧美版在2015年11月24日曾刊登一篇名为《UK watchdog examines insurers’ use of big data》(英国监察机构检测保险公司对于大数据的使用)的文章。文章指出,FCA即英国金融市场行为监管局已正式发表声明,表示明年会继续监视金融技术开发以及金融技术对于公司和投资者的影响,比如它会开展一项专门针对”保险公司大数据使用现状“的市场调查,从而更为精准有效的打击预防以金融技术为核心的新型金融犯罪行为。(详见 FCA Business Plan 2015/16 )
金融量化中的“少林“和”武当“
在互联网的营销造势之下,一时间”大数据技术“风头无二,备受推崇。但若真问究竟什么是大数据,只怕众多跟风者也只能爆出个“Big Data” 装装“逼格”。其实在金融领域,并非只有“大数据”一枝独秀,下文我们就来谈谈“大数据”的发家史以及它和传统定价模型一较高下的那些事儿。
在开始之前,我们不妨先来厘清金融系统的基本架构。如果按照市场等级分,我们可以将金融市场分为一级市场和二级市场;但如果按照金融产品分,我们则将金融市场分为资本市场(主要进行股票买卖)、债权市场、商品市场、货币市场、衍生品市场、保险市场、以及外汇市场。
放眼中国金融市场,根据世界交易所联合会(World Federation of Exchanges)出具的报告,在2014年,中国金融期货交易所 (简称中金所,China Financial Futures Exchange)的股票累衍生品的交易表现并不尽如人意。按成交易合同的数量计位,中金所只有在股指期货方面成交量排名全球第五,其余如股指期权、个股期货和个股期权等,均未能跻身前十。这一成绩对于全球第二大经济体来说,无疑是不相称的。但考虑到上海证券交易所在2015年2月9日才开始上市交易上证50ETF 期权合约,而且暂时还尚未发行个股期货和期权产品,这样的排名表现倒也显得合情合理。不过,中国的金融市场也并非完全没有可圈可点之处,比如在商品期货方面,中国交易所就占了“成交量前五排名”中的三个席位,分别是位列状元的上海期货交易所,位列探花的大连商品交易所以及紧随其后的郑州商品交易所。由此可见,中国金融市场目前仍主要倚重传统的金融产品,与欧美金融市场相比,既有理论和技术差距,但也充满了上升空间和发展机遇。
在熟悉了金融市场的基本分类之后,我们还需进一步了解一下金融市场中的买方和卖方。顾名思义,所谓买方,就是金融产品的购买者,而卖方则金融产品的出卖者。以比较常见的金融衍生品交易,尤其是股票类衍生品交易为例,那些口若悬河、舌灿莲花的卖方角色多由投资银行和券商来担当,他们主要从事设计开发原始产品以及负责原始产品的销售推广;而对冲基金、养老基金、信托公司以及资产管理公司则在这一环节里初步充当买方的角色,他们可以从投行或券商那里购买原始产品,然后通过不断优化这样的原始产品以直接销售获利,或者利用这样的原始产品来间接优化自己的固有产品,从而提升其固有产品的市场价值。比如卖方可以从买方那里购买“定价产品”,然后借助这样的产品来其确定现有产品的交易价额,并最终按该价格将其产品卖给市场终端的投资者,以保证其收益的最大化。这些“定价产品”,即运用数学和计算机模型而把未来收益数量化,并可由此帮助金融机构制定出最优价格方案的产品,就是本文想要着重探讨的 “金融量化技术”的典型代表。
总的来说,金融量化技术可分为两大类,一类是P Quant,另一类是Q Quant。它们虽同为资产定价机制,但其原理和受众却大相径庭,而且各自的风头此消彼长,真可谓是金融量化领域的“少林”和“武当”。
Q Quant是指风险中性测度。在“风险中性”的理论假设下,历史数据只是记录过去的数字,它们与未来无关,因而并不能直接帮助预测金融产品的未来走势,定价机制还是主要应依据数学模型,比如随机过程、偏微方程,所以由此推导出的定价模型大多充满了学院派气质且理论性十足,显得高深晦涩,非常人可试。P Quant则指真实概率测度,与“风险中性”不同,在“真实概率”的理论假设下,搭建定价模型所需的概率分布应根据历史数据而估算出来,而非仅凭数学模型而演算出来,换言之,该种定价模型所预测出未来走势主要是以数据统计为基础的,因而是“真实”的,而且数据量越大,其预测效果就越可能接近未来的实际效果,也就是所谓的“大数据”(Big Data)。为了处理卷帙浩繁的历史数据,产品开发者们往往离不开计算机的辅助,所以与 P Quant相关的产品技术也主要是时间序列、贝叶斯算法、机器学习等与计算机技术密切相关的建模方法。
由此可以看出,根据对历史数据的亲疏不同,Q Quant和 P Quant的区别其实显而易见,前者基于对未来的假设推算现在,后者基于对历史的借鉴推测现在。两者虽然都需要运用到历史数据,但前者通常是先搭建一个模型,然后再通过历史数据来不断精化该模型的参数性能,因而历史数据的作用主要是优化模型的磨刀石;而后者通常会先搭建数个备选模型,然后将历史数据分别套用到不同的备选模型中去,并根据由此产生的计算结果来选择表现最佳的那个模型,因而历史数据在 P Quant中的作用就升格成了选择模型的试金石。我们很难论断究竟哪一种理论更为科学,因为历史既值得鉴戒,但历史也不会重演,历史数据既可能帮助我们科学预测,但也可能带领我们误入歧途。
不过这一区别对于角色各异的金融市场参与者而言,却是意义非凡。具体说来,由于 Q Quant主要背靠数学模型而不依赖历史数据,这意味着即便在数据相对匮乏的情况下,我们也依然可根据该理论凭空开发出一些新的产品,这对金融市场中的卖方而言,无疑是喜闻乐见的。以投行和券商为代表的卖方,大多从事衍生品定价,即通过开发和销售新的金融衍生品来实现获利,同行竞争者之间比拼的是原始产品的技术优劣和认购市场的实际需求,所以他们更倚重 Q Quant所具备的可实现“从无到有”的制造特性。
或许有些人不禁会好奇,作为投行和对冲基金等金融机构的生财利器,究竟什么是金融衍生品?从本质上说,金融衍生品就是一份合同,而且是一份可帮助买方实现风险控制和套利交易的合同。比如个股期权就是典型的金融衍生品,它赋予了买方在约定时间内可按照约定价格买入或者卖出特定股票的权利。试想,如果该约定价格过低,那么卖方将会得不偿失,因为这相当于为买方提供了一个廉价的风险对冲工具,使其可以轻而易举地实现低买高卖,这显然并非卖方的本意初衷,因而实际发生的概率也微乎其微。但如果该约定价格过高,那么卖方就可能面临有价无市的尴尬窘境甚至产生流动性风险,并最终导致血本尽赔,颗粒无收。所以个股期权的卖方或做市商在设计定价或者交易该产品时,往往并不会贪心不足,漫天要价。可是究竟怎样才能保证合同的价格公平合理,从而有利于实现买卖双方的互利共赢?考虑到这类金融衍生品本身只是一纸合同,不像股票一样有历史数据可循,这时卖方往往就会借助 Q Quant理论,通过利用数学模型来设定既定股票的未来走势及波动率,进而推算出该个股期权的合理现值。
如果说 Q Quant主要是卖方的心头好,那么 P Quant则是可谓是买方的白月光 。因为以对冲基金为主的买方主要从事大批量的产品筛选和投资决策,故而其核心业务本身就对数据处理技术有着极高的依赖度。此外,作为中间商,买方其实并不参与任何产品开发,而是仅仅专注于对现有产品的精细化加工,所以 P Quant所具备的“百里挑一”的优化特性无疑正中其怀。
实际上,当对冲基金在设计套利策略时,他们往往会尽可能地去搜集与其产品相关的所有历史数据,并对这些数据进行多角度、全方面、深层次的比较分析,从而寻找出众多历史数据之间的内在联系和统计规律。以股票策略为例,通过对现有数据的剖析归纳,对冲基金往往希望准确预测出诸如“上市公司的财务状况会对公司股价产生何种影响”,“特定行业的整体环境以及宏观经济的政策调控又会对该行业上市公司的股价产生何种影响”,并由此制定出极具产品针对性的套利策略。
在某种程度上,P Quant的跌宕起伏浮其实就是数据分析技术的兴衰荣辱。在历史数据基数不够,并行运算技术尚不成熟的年代里,P Quant理论难免因为外力不足而显得捉襟见肘,那时各类金融衍生品凭借着Q Quant定价模型大行其道,并一时间风头无两。可事实证明,即使是华尔街的天之骄子们,也最终难逃物极必反的命数。金融衍生品的空前成功使得那些狂热分子逐渐走火入魔,并开始不计成本的发行各类晦涩难懂但又毫无市场价值的金融衍生品。这一切的盲目投资的最终都在金融危机的血洗之下的惨淡收场,不仅使得投资者对 Q Quant失去了信心,而且也让Q Quant从此元气大伤。P Quant就是在这样的背景下,头顶着互联网的东风,脚踩着 Q Quant的疮痍,而一跃登上了时代舞台。
计算机技术的日新月异,使得海量数据处理瞬间成为了可能,在“大数据技术”的强力支持和“电子化交易”的产业革新下,P Quant乘势而发,如有神助,彻底告别了过去因为数据不足和技术不够而难有用武之地的困顿局面。近年来,众多欧美对冲基金以及投行的自营盘都开始热衷于开发基于“大数据技术”的套利策略,其中最具代表性的包括温顿资本 (Winton Capital)在牛津设立数据研究中心,以及瑞信信贷(Credit Suisse)对HOLT选股系统进行技术革新等等。此外,今年8月还有消息称,大摩 、小摩 和高盛未来将可能共同组建大数据公司,从而为三者提供“证券产品参考数据”(Securities Product Reference Data)。虽然时下这场以 P Quant为主角的数据盛宴卡司豪华,并受全民热捧,但念其对历史数据和电子技术的高度依赖,其未来的发展之路也依旧扑朔迷离。
如何捧起“量化”的金饭碗
尽管 Q Quant和 P Quant此消彼长,互不承让,但其终究还是同属“量化”一门;尽管金融市场中的买方和买方对P Quant和 Q Quant各有偏重,喜好相异,但其终究还是离不开“量化”之功。欧美投行几乎都无一例外的设立了“量化”部门,而与此相关的量化分析职位更是成为了众人眼中的香饽饽。即使是一个入门级量化交易员也往往能够拥有10万美金起的基本年收入,这对于普通交易员而言,无疑是可望而不可及的。
但与金饭碗相匹配的,便是这些职位的高要求。一位合格的量化交易员不仅需要拥有深厚的数学背景和坚实的金融理论,而且还必须掌握丰富的编程语言和熟练的建模技能。一般而言,为了保证模型计算的安全快速,Q Quant大多会倾向使用VBA/C++和C#等面向对象的语言或者类似F#这样的函数式语言。而P Quant则要求开发人员首先利用Hadoop或者Spark 来搭建初步的模型框架,并通常会为其提供分布式文件系統,用以存储所有计算节点的数据,而后再要求其根据R-Hadoop或者Spark-Python/Scala等程序语言来实现具体算法。毫不夸张的说,是人脑发明了前所未有的量化技术,而电脑则开创了绚烂恢弘的量化时代。
(作者介绍:伦敦大学学院(UCL)在读金融数学博士,Crescent Quant坤逊金融信息服务(上海)有限公司创始人,曾负责Credit Suisse瑞士信贷伦敦团队证券类量化策略研发。本文仅代表作者观点。责任编辑邮箱:tao.feng@ftchinese.com)