选择：反馈最后会把你带到陷阱

2019-09-26 本文已影响0人阳光下的一粒小种子

原文摘要

人的两种认知框架和学习模式：自上而下，还是自下而上？追求定于一，还是安于多？柏林说，刺猬偶尔蒙对，但经常铸成大错。狐狸小错不断，但也不犯大错，从反馈中学习，保持开放，持续进化。在柏林之后，刺猬与狐狸之争似乎就有了定论，狐狸赢了。

从反馈中学习一般有三种方法。

第一种方法是从自己的经验中学习。

所谓“赢继续输就变（Win-Stay-Lose-Shift）”，赢就接着来，输就换个招。

从反馈中学习的第二种方法是模仿。

别人怎么成功，你就学习他的成功经验，哪怕是想象出来的成功经验，常常有用。

最有意思的地方是由表及里，从外在成功倒推内在的成功机理，先回溯，再模仿。

从反馈中学习的第三种方法是进化算法。

进化算法就是模拟自然界的套套逻辑（tautology）：适者才能生存，而生存下来的就是适者。自然界就在循环论证。

只是别忘了一点：重视反馈要有限度。狐狸很精明，太精明了也不行，有陷阱等着它。

适应性学习的共同陷阱，就是它们都是短视的。无论是机会还是威胁，它们都更重视近在眼前的机会和威胁，而不够重视将来的机会和威胁。

适应性学习之所以有用，就是因为短视有合理性：你不在每个短期中活下来，就没有长期可言。但过度偏好即期收获也挖下陷阱，你在每一个短期中都得分，变得越来越适应环境，获得了越来越多的稳定，到最后没有新东西，环境一旦剧变，你拿什么去对付变化？

1.如果你是狐狸，请继续适应性学习，尽量对刺猬好一点，因为你可能总有一天要搭他们的便车，同时把他们看紧一点，你也可能被他们带进坑里。

2.如果你是刺猬，请明白自己大概率会失败。但如果成功，整个社会将称你为英雄，因为要引诱你走上这条险路，把狐狸们带出绝境。

背景

这一讲的灵感来源于一本讨论学习型组织的力作《企业行为理论》（A Behavioral Theory of the Firm），这是本很老的书，至今难说被超越。管理学界做过一次内部调查，大师多了，哪位能称作大师中的大师？就是引领大师的那种人，第一名即本书作者之一马奇（James G. March）。