有限理性之双曲贴现
有限理性
有限理性是指介于完全理性和非完全理性之间的在一定限制下的理性。有限理性是为抓住问题的本质而简化决策变量的条件下表现出来的理性行为。有限理性(bounded rationality)的概念最初是阿罗提出的,他认为有限理性就是人的行为“即是有意识地理性的,但这种理性又是有限的”。
基本定义
有限理性
一是环境是复杂的,在非个人交换形式中,人们面临的是一个复杂的、不确定的世界,而且交易越多,不确定性就越大,信息也就越不完全;二是人对环境的计算能力和认识能力是有限的,人不可能无所不知;此外,在很大程度上,由于受到情境的影响,人们使用“第一系统”进行加工,理性在这里根本就未发挥作用。
20世纪40年代,西蒙详尽而深刻地指出了新古典经济学理论的不现实之处,分析了它的两个致命弱点(1)假定目前状况与未来变化具有必然的一致性;(2)假定全部可供选择的“备选方案”和“策略”的可能结果都是已知的。而事实上这些都是不可能的。西蒙的分析结论使整个新古典经济学理论和管理学理论失去了存在的基础。西蒙指出传统经济理论假定了一种“经济人”。他们具有“经济”特征,具备所处环境的知识即使不是绝对完备,至少也相当丰富和透彻;他们还具有一个很有条理的、稳定的偏好体系,并拥有很强的计算能力,靠此能计算出在他们的备选行动方案中,哪个可以达到尺寸上的最高点。西蒙认为人们在决定过程中寻找的并非是“最大”或“最优”的标准,而只是“满意”的标准。
以稻草堆中寻针为例,西蒙提出以有限理性的管理人代替完全理性的经济人。两者的差别在于:经济人企求找到最锋利的针,即寻求最优,从可为他所用的一切备选方案当中,择其最优者。经济人的堂弟——管理人找到足可以缝衣服的针就满足了,即寻求满意,寻求一个令人满意的或足够好的行动程序。西蒙的有限理性和满意准则这两个命题纠正了传统的理性选择理论的偏激,拉近了理性选择的预设条件与现实生活的距离。
理论
"有限理性"概念的主要提倡者是诺贝尔经济学奖得主西蒙(Simon)。 自从他提出有限理性概念半个世纪以来,经济学家对什么叫有限理性至今没有公认一致的看法。
西蒙当年认为有限理性的理论是 ' 考虑限制决策者信息处理能力的约束的理论 '。他提议将不完全信息,处理信息的费用和一些非传统的决策者目标函数引入经济分析。但是近来不少经济学家认为这三方面的研究并不足以构成有限理性概念的核心。西蒙是个反对主流经济学中的最优决策模型和全部均衡概念的人,但是过去二三十年中,主流经济学却在最优决策和全部均衡的分析框架中将西蒙提到的这三方面研究全部吸收了。首先以Wald 为代表的主流经济学家将不完全信息引入传统的最优 决策模型和全部均衡及对策论模型,使得主流经济学中的最优决策和全部均衡模型可以 用来揭示不 完全信息 对经济行为及其交互作用的影响。
但是不少经济学家认为这种引入不完全信息的模型并未抓住有限理性概念的实质。他们认为不完全信息不是有限理性。例如Aumann(1997)认为大多数有不完全信息和信息不对称的对策 论模型并不是有限理性模型,而是超级无限理性模型。例如有名的Milgrom的防止进入的序贯均衡模型中虽然有不完全信息和信息不对称,但这个模型中,没有完全信息的局中人知道对方的生产函数,目标函数以及一个不确定的生产函数参数的所有可能状态,及各种状态发生的事前概率,他可以用动态规划和这些不完全信息算出完全的最优动态对策,并对对手的最优动态对策完全了解。这哪是有限理性,这明明是超级无限理性,比传统的完全竞争模型中对个人理性的要求要高得多。
在传统的瓦尔拉斯完全竞争模型中,每个决策人不知道他人的生产条件和嗜好及他们的决策,他只根据价格信号做决策,因此在这种模型中,每个决策者所需的理性和信息处理能力比有不完全信息的对策论模型低得多。所以有些经济学家认为上世纪八十年代兴起的有信息不对称的动态对策论模型在推动有限理性数学模型方面是一个失败。
以Radner(1996)为代表的经济学家将最优决策的计算成本引入经济模型,可以说是将西蒙提到的有限理性概念中的第二个因素变成了主流学派的数学模型。但不少经济学家例如Aumann(1997)最近指出,这类模型仍然是完全理性模型,信息处理费用本身并不是有限理性概念的实质。
最近发展起来的五花八门包含决策和计算成本的经济模型也证明,如果计算和收集信息的费用很高的话,最优决策和全部均衡中都会出现直观决策,模仿(所谓羊群行为),按固定规则决策等看似不是完全最优化的决策过程,但这类决策不是象西蒙所言的非最优化而只求满意的决策,而是考虑计算成本的约束条件下的最优化决策。最优决策的本质并未变,只是当约束条件复杂时,最优决策的形式也多样化了。
因此可以说西蒙提到的有限理性的三要件都没抓住有限理性概念的要害。以完全理性为基础的主流学派模型可以将这三要件在完全理性最优决策和全部均衡框架内吸收。九十年代的动态对策均衡概念就可以用来预测供求不等的现象。钱颖一的有名的软预算约束对策论模型中,社会主义经济中的长期供不应求就是自利决策交互作用产生的一种任何个人都不能单方改变的后果,这种后果就是供求不等的均衡。所以均衡并不一定意味供求相等。很多动态均衡模型还能预见内生变量自发地随时间流逝而演变。所以西蒙及奥地利学派,非线性演化经济学派反对均衡的一些概念都被主流学派全部均衡模型所吸收。
研究
1980年代以来有几个研究方向开始触及有限理性概念的实质。对策理论经济学家早就用囚犯难题的模型证明,个人完全理性决策的交互作用可能导致全社会无理性的后果,而 Neyman(1985)和Rubinstein (1986) 发展了有限固定规则机制 (finite automata)模型。在这类模型中,对策局中人没有什么最优决策的理性,只是按固定规则决策,而社会理性却有可能在个人有限理性的基础上出现。 Smith(1982), Weibull(1995),Fudenberg和Lerine(1998)发展了不少演化对策模型。在这类模型中个别决策者没有最优决策的理性,而个人决策之间的交互作用会使选择不同策略的局中人人数随时间演化,一些看似理性的所谓纳什对策均衡会在这些无个人理性策略演化过程中出现。
一些经济学家指出个人理性和社会理性是两个不同的概念,所有个人的个人理性可能产生社会无理性的后果,而缺乏个人理性的决策的交互作用之演化有可能产生从全社会而言看似理性的后果。而颤抖之手(trembling hand)对策模型预见个人非理性策略有可能在均衡中占优势。
Guth 等人(1982),Binmore等人(1985)和Aumann(1997)将游戏规则理性与个人行为理性相区别,他们认为规则理性是一种有限理性。他们用社会实验证实人们追求规则理性的行为(例如追求 ' 玩的就是公平 ',Fair play)看似象是个人行为的非理性。规则理性往往不能由个人行为的理性产生。
早在1921年,Knight就指出有限理性的根基是所谓 ' 根本的不确定性(Fundamental uncertainty)',它不同于不完全信息。Georgescu-Roegen(1971), Shackle(1961), Slater和Spencer(2000)都将这一思想发挥。他们认为不完全信息是指决策者知道某一变量所有可能的取值,以及每一值发生的概率,而根本的不确定性是指决策者根本不知道变量有几个可能的值,更不知道每一个可能值发生的概率。凯恩思学派的经济学家称这种根本不确定性为认识力的不确定性 (epistemic uncertainty, 见Lawson,1960,pp.42-43)。
这些经济学家还认为所谓根本的不确定性不是外生给定的自然界的不确定性,而是人类决策交互作用内生地产生的社会不确定性。换言之,哪怕自然界完全没有不确定性,人们决策互动的后果也可能产生根本的不确定性。凯恩斯(1973,p.113)将这种社会性内生的不确定性称为碰运气(aleatory)不确定性。如果我们以这种根本的不确定性作为有限理性概念的基础,则我们可看出,西蒙提到的和对策论模型中的不完全信息与有限理性根本不搭界。不完全信息概念可能与完全理性并行不饽。实际上有信息不对称的动态对策模型中,岂止是完全理性,每个局中人都具有超级完全理性。
最近黄有光,姚顺田,杨小凯,赵一民等经济学家掀起一阵用瓦尔拉斯均衡模型研究有限理性理论的浪潮。他们重提Hurwitz定理,该定理证明瓦尔拉斯竞争模型是所有可能的激励机制中达至社会理性所需信息处理费用最小的激励机制。换言之,瓦尔拉斯竞争机制在达到社会理性的条件下,对个人理性的要求最低。这种特点不但指社会总的计算费用低,而且个人决策面临的不是不完全信息,而是 ' 根本的不确定性 ' 。每个决策者不但不知道他人的生产函数,效用函数,而且对有不确定性的参数个数,取值范围,及其概率分布一无所知。如果他们要获得这些不完全信息,收集不完全信息的费用大得不可行,即使收集到了,以此为基础计算最优决策的费用大得不可行。因此每个人只能按照看得见的市价做决策,而不理他人的决策及他人的私人信息。
而市价与决策又有互相依赖关系。更复杂的是,当人们用超边际分析(给定职业对资源配置的边际分析加选择职业时用的总费用-效益分析)选择专业时,每个人的最优专业化水平依赖于看得见的价格,而什么价格看得见又与所有人选择的专业化水平有关。例如如果所有人选择自给自足,则市场上就看不到任何商品的价格。
由于这种看得见的市价和决策之间的互相依赖性,一个经济中即使没有外生的不确定性,个人决策之间及其与价格的互动也会产生社会性的根本不确定性。
而人们的做决策过程,就是一个通过他们决策的互动以及所有人决策与价格之间的互动,逐渐用价格制度试验不同的分工网络,一步一步通过社会试验,了解对全社会有利的组织信息。
在这个过程中,价格制度只能逐步向人们传递抽象的信息,而不能传递具体的私人信息。例如当木材价格上涨时,房层建筑商了解到从他自己的利益而言,最优决策应该减少木材的使用量而增加其它材料的使用量。但他并不可能知道木材涨价是森林起火,还是人们对木材家具更喜爱产生的。而这种与他自己利益有关的信息就包含了所有人自利决策交互作用对全社会福利影响的信息,尽管个人并没有能理解这全社会福利信息的理性。换言之,在这个社会用价格制度做社会试验,逐步获得社会理性过程中,个人的理性是极其有限的。个人面对根本的不确定性,他不可能了解其他人的私人信息。也就是价格制度和社会试验不可能减少根本的信息不对称,相反它可以在每个人只知道全社会信息的极小一部分时充分利用所有分散在各地,各个专业的信息。由于这种自由价格制度的功能对个人理性和信息能力要求极低,所以可以大大促进劳动分工,而劳动分工又会增加信息不对称。例如每个专家根本不必懂其它专业的事(隔行如隔山)也可以通过市场竞争享受各行各业价廉物美的产品。
这正是海耶克,奥地利学派所说的市场在个人有限理性和根本性不确定性条件下,综合利用分散在各地各人的信息的功能。
黄有光,杨小凯将他们描述有限理性的模型称为瓦尔拉斯序贯均衡模型(Walrasian sequential equlibrium)。,姚顺田用不动点定理证明了序贯均衡存在的条件。
例子
我们用几个例子说明瓦尔拉斯序贯均衡概念。首先。看麦当劳连锁店的创立和发展,在麦当劳连锁店创立前,饭馆的价格相当高。当时市场对饭馆的需求也似乎与供给相当。如果饭馆服务的价格稍微降低(以经济学术语而言即为在边际上调节),利润将会减少。因此,用传统经济学来指导决策将会导致这样的结论:市场已在均衡中,利润已最大化,创办更多饭馆或大规模减价只会造成损失。但是,当麦当劳连锁店的创办人认为可能有另一种市场均衡,在这种均衡中,饭馆服务价格比现有饭馆低得多,因而很多人会减少自己做饭的次数,而增加对专业饭馆的依赖,专业饭馆由于生产规模扩大,内部专业化加深,也可以使服务成本大规模地下降,因此大规模降价也会有利可图。如此一来,麦当劳创始人就不是以当时市场的边际调节信息定价,而是将价格订在普通人能经常上馆子的很低水平。麦当劳一开始就把目标定在大规模经营,用连锁店的合约形式组织总部与分店之间的分工,使专业化的计划管理,餐馆设计,原料采购,广告成为总部的专门部门。结果这种 ' 组织创新 ' 成为本世纪最大的商业成功之一。传统的经济学对于分析这类 ' 组织创新 ' 的奥秘完全无能为力。其原因是,传统经济学的边际分析以内点最优决策为基础,
而决策从一个角点转向另一个角点时,会造成产量和价格不连续地大幅跳跃,所以边际调节根本不能提供最优决策所需的信息。
人们要得到决策所需的所有信息,必须试验所有不同的角点。这一方面意味着组织试验会产生风险,成败不可能像边际调节那样肯定:另一方面,试验必须是从一种组织结构跳跃到另一种完全不同的结构,而不能只是边际调节。这就意味着众多的破产案例其实是人们获得决策信息所必须的组织试验。破产企业家的贡献不见得低于成功的企业家。在这种组织试验过程中,成功在很大程度上是可遇而不可求的事,如果人人都要等到有十足把握才试验目前不存在的组织,则人们永远不能获得决策所需的信息。如果人口中相当一部分人在没有十足把握时就去试验各种不同的组织结构(不同的角点),则很多不同的角点就是会被试验,其中大部分当然不是最优结构,而破产就提供了有关最优结构的信息,使成功的组织得以被人模仿和发展。
所以,看看经济发达的美国,我们可以看到其破产率也是最高的国家之一。这说明有很多企业家冒风险在试验不同的组织,因此成功的组织出现的概率就会上升。法人制度和股市的发展,使这种组织试验的风险分散,因而加速了组织试验和企业家精神的发展。从这点而言,社会对失败的企业经验应非常重视和给以适当的尊重,不要简单地将经济理论性与成功划上等号。
这个例子说明,企业家要搞组织试验必须借助大量资本。因为新的角点均衡并不存在于现有市场中,而人们一般只相信现有市场的边际调节提供的信息,企业家要说服人们与他一同去进行这种冒险的组织试验,只能以钱把他们引出来。而一旦新的角点均衡不如现有均衡,则这笔投资就会血本无归。因此,资本和风险是组织试验不可或缺的两个特点。这种对资本的看法与传统经济学对资本的看法很不一样。传统经济学中,资本是一种生产所需的资源,资源越多,则产出也越多。而用角点分析方法来看资本。我们对经济的最优决策有赖于我们对组织的信息,这信息的获得却依赖足够多的组织试验,而进行组织试验却是要用钱把人们引来与企业家共同进行,这试验的成本就是资本,而资本的收益就是通过试验所获得的有关组织的信息而赚的钱。
在有专业化加速学习速度的效果时,天生的比较优势并不重要,而进入专业化与学习加速的良性循环(正反馈)却非常重要。一个先天不足的人,一旦通过广告或自我推销的成功而进入某个专业,专业生产会提高他的学习能力,这反过来用高效率扩大了他的市场,使他有机会加深专业化,进一步加速学习过程。这种自我加速的过程往往能使某些没有先天优势的人在短期内超过一些有先天优势,但却没进入这个良性循环过程的人。有人将这种良性循环过程称为 ' 自我发现 ' ,实际上这种过程是 ' 自我创造 ' ,而不是发现先天就存在的自我。
正因为组织试验是人们获取经济信息所必需的,而可能的角点之间的组合造成的可能的组织结构和产权结构无穷多,人们不可能穷尽所有组织试验,因此,人们对组织的信息总是有限的。在这种信息不够的情况下,人们不应对经济理性过于迷信,而应对看似无理性的组织试验充分开放头脑,不要有预先的成见。充分认识尽可能试验不同的组织,在充分多试验中靠碰运气发财的态度,比预先算计清楚稳操胜券的态度更可取。1000年前,商人曾被人认为是一种对社会没有贡献的行业,这种预先的成见曾大大阻碍了经济的发达。问题不是商业这个专业究竟是否有其价值,而是这种不开放的头脑。现在,我们也听到人们在谈论台湾的 ' 产业空洞化 ' 如何对经济有害,中国的劳力密集工业的发展如何不利于技术的提升,以及景气循环如何有害生产力。所有这些似是而非的论调与当年重农抑商的论调都是同样的思想方法。你怎么知道台湾的 ' 产业空洞化 ' 不好?一种组织结构在市场竞争中自发地出现,必有其生存的理由,对这种复杂的理由,我们最好不要轻易下结论,而是对各种组织试验开放自己的头脑,让时间去对不同的组织试验下结论。以产业政策而言,目前香港和以前台湾没有产业政策的效果,看来比新加坡和韩国的产业政策就不见得差(不少经济学者论证香港的无产业政策比新加坡的产业政策效果为好,而台湾也胜过韩国)。
20 世纪50年代香港政府没有如何产业政策,而开创了世界上第一个成功的外向型出口劳力密集产品的工业化模式。台湾在50年代,政府强制推行进口代替,成效不彰,在国际竞争压力和美国压力下,50年代末改取香港式的
自由化,国际化政策,市场自动采用了香港式的出口导向工业化模式,创造了台湾奇迹。后人称这是政府有意设计了这个工业化模式,实际上没有任何政府有能力设计此模式,而是香港市场自发地创造了这个模式,然而其他三小龙的政府加以模仿。这些经验说明了市场在组织试验方面比政府要高超得多。市场为什么在组织试验方面比政府的能力高超得多?
这是由于经济发展的实质在于分工专业化的发展,随着分工的演化,每个专家所知道的信息相对于全社会的知识越来越少,信息越来越分散在不同的专业中,而市场的功能一方面是促进这种信息的分散化和信息不对称(一种专业产品的买方和卖方对生产过程的知识差别增大),以促进社会获取知识的总能力和增进生产力;享受所有不同专业的信息带来的生产能力。市场并不是让所有人分享所有信息,而是让人们在不必知道他的专业之外的生产知识时也能享受社会的生产力。正因为市场上的公平竞争能将分散的专业知识加以综合运用,所以市场所利用的信息比任何专家所知道的信息都多。因此,市场所利用的信息也比经济学家或政府官员所知的信息多。加上迷信政府或经济学家的经济理性会限制经济组织试验,所以,市场试验经济组织的能力比政府和经济学家要高超得多。因此,我劝读者对目前一些经济学家批评台湾 ' 产业空洞化 ' 或中国 ' 产业低级化 ' 的论调千万不可轻信。其理由就是,市场上出现的组织模式所包含的信息,比这些经济学家知道的多得多。
由于根本的不确定性,人们不可能算计自己决策与其他人决策的交互影响,只能依赖瓦尔拉斯定价机制通过社会试验逐步了解所有人决策互动及决策与价格互动的后果。在这个动态过程中如果价格信号与决策之间有时间滞后,则反馈机制会产生市场价格不是高于就是低于静态均衡水平的波动,也就是金融家索罗斯所说 ' 市场永远是错的 ' 。如果市场上所有决策的交互依赖程度很高或用数学语言;来描述,代表这个机制的微分-差分方程是高度非线性的。这个瓦尔拉斯价格机制会产生有名的紊乱系统,这种紊乱系统虽然由确定性微分-差分方程产生,但其唯一可预测的特性就是不可预测性。笔者将在另文中讨论这种 ' 市场永远是错误的 ' 和 ' 市场不可预测 ' 问题,它们正是人的有限理论造成的根本性社会不确定性的特点。
双曲贴现
双曲贴现又称为非理性折现,是行为经济学的一个重要部分。这个现象描述折现率并不是一个不变量,具体是指人们在对未来的收益评估其价值时,倾向于对较近的时期采用更低的折现率,对较远的时期采用更高的折现率。该理论在其他许多领域也有应用,例如药物依赖,赌博等关于自我控制的行为。
双曲贴现指的是人们面对同样的问题,相较于延迟的选项更选择倾向于及时的。在决定要做出什么样的选择时,拖延的时间是一个重要的因素。
折现
简单来说,大多数人可能会选择今天拿60元,而不是一年后拿到100元。因为同样数量的钱,在今天的价值是要比日后高的,因为今天的钱可以投资,在未来得到更多的钱。假设,利率是66.7%,那么一般来说今天拿60元和一年后拿100元是没有多大区别的。
双曲贴现
继续上面的例子,但这次让人们选择在一年后拿到60元,或者在两年后拿到100元,结果大多数人会选择在两年后拿100元。也就是说,对于同样时间间隔的两笔收入(一年),人们会因为收到钱的时间距离现在的不同,而做出不同的决策。即面对同样的事件,人们在现在这个时刻,与站在未来某个时间点上做出的决策相比,可能有所不同。
数学模型
一般来说,双曲贴现的折现率可以写成:
f(D)为折现率,D为获得报酬距离现在的时间,k为表示折现程度的参数。
与之相对,普通的指数折现公式为:
一个简单的例子可以说明这两种折现方式的不同:
为了简化计算,让结论更为直观,我们假设普通指数折现的公式为
双曲折现的公式为
其中,n是未来收到报酬的时间(年)。
回到开始的例子中。对第一种情况采用指数折现,一年后人们拿到的100元,在今天为
这小于今天拿到60元的价值。而采用双曲折现,其价值为:
这时两种方法计算出的结果相同,人们均会选择在今天拿到60元。
而对于第二种情况,采用指数折现时,站在一年后的时间点上,收到的100元的价值为:
与第一种情况结果相同,人们仍然会选择在一年后收到60元。而采用双曲折现时,其价值为:
其价值要大于在一年后拿到60元,所以人们会选择在两年后收到100元。
这个例子说明了双曲贴现方法与普通贴现方法的不同,也解释了人们的非理性行为。
Changelog
190526 百度百科