选择:反馈最后会把你带到陷阱
原文摘要
人的两种认知框架和学习模式:自上而下,还是自下而上?追求定于一,还是安于多?柏林说,刺猬偶尔蒙对,但经常铸成大错。狐狸小错不断,但也不犯大错,从反馈中学习,保持开放,持续进化。在柏林之后,刺猬与狐狸之争似乎就有了定论,狐狸赢了。
从反馈中学习一般有三种方法。
第一种方法是从自己的经验中学习。
所谓“赢继续输就变(Win-Stay-Lose-Shift)”,赢就接着来,输就换个招。
从反馈中学习的第二种方法是模仿。
别人怎么成功,你就学习他的成功经验,哪怕是想象出来的成功经验,常常有用。
最有意思的地方是由表及里,从外在成功倒推内在的成功机理,先回溯,再模仿。
从反馈中学习的第三种方法是进化算法。
进化算法就是模拟自然界的套套逻辑(tautology):适者才能生存,而生存下来的就是适者。自然界就在循环论证。
只是别忘了一点:重视反馈要有限度。狐狸很精明,太精明了也不行,有陷阱等着它。
适应性学习的共同陷阱,就是它们都是短视的。无论是机会还是威胁,它们都更重视近在眼前的机会和威胁,而不够重视将来的机会和威胁。
适应性学习之所以有用,就是因为短视有合理性:你不在每个短期中活下来,就没有长期可言。 但过度偏好即期收获也挖下陷阱,你在每一个短期中都得分,变得越来越适应环境,获得了越来越多的稳定,到最后没有新东西,环境一旦剧变,你拿什么去对付变化?
1.如果你是狐狸,请继续适应性学习,尽量对刺猬好一点,因为你可能总有一天要搭他们的便车,同时把他们看紧一点,你也可能被他们带进坑里。
2.如果你是刺猬,请明白自己大概率会失败。但如果成功,整个社会将称你为英雄,因为要引诱你走上这条险路,把狐狸们带出绝境。
背景
这一讲的灵感来源于一本讨论学习型组织的力作《企业行为理论》(A Behavioral Theory of the Firm),这是本很老的书,至今难说被超越。管理学界做过一次内部调查,大师多了,哪位能称作大师中的大师?就是引领大师的那种人,第一名即本书作者之一马奇(James G. March)。