制度设计丨制度设计中的博弈论分析
摘要:管理制度设计,离不开博弈论分析和“机制设计理论”,因为制度运行最终趋向的,必然是一种博弈均衡。管理制度设计时,需要建立博弈分析模型去寻找均衡点,改变均衡点,促成均衡点转向制度设计目标。
而博弈论分析,则是为了弄清楚多个主体的利益追求的相互作用、相互制约。
关键词:制度博弈;博弈论;
制度作为“活的游戏规则”,不是存在于纸面上或屏幕上,而是存在于制度主体的相互博弈中,而且制度博弈有其自身的独特性:
(1)重复博弈:制度每天存在着,博弈每天继续着,参与各方每天重复着昨天的故事,日复一日,年复一年,直到新的制度实施。
(2)不对称信息博弈:参与各方对情况的掌握,往往是“天知、地知、你知、我不知”,信息是不对称的,一个常见的现象,公司的风吹草动员工全都知道,员工的私下行为公司很难掌握。
(3)随机化策略博弈:参与各方不愿让对手猜到自己的底牌,不愿让别人猜到自己下一步要出的是“石头”还是“剪子”,因而会随机化自己的策略,例如一个老是请假的员工,每次编造的理由都会不一样,上个月是“奶奶去世了”,这个月则会换成“姥姥去世了”。
既然博弈中的制度主体“大大地狡猾”,那如何巧妙地利用各方的互动博弈,来为制度目标服务呢?其实也不难,只要让博弈均衡点与制度目标相重合,当互动博弈趋向均衡时,也就趋向制度目标了。换句话说,如果制度目标就是博弈均衡点,即使制度主体不愿意朝着制度目标方向走,但在其他方的牵制和拉扯之下,也不得不这样做。
案例:通通公司的量化考核为何难以推进?
通通快递是一个家族企业,每一个部门经理都是皇亲国戚。在这样一个奇特的社会生态系统中,山头林立,宗派横行,没有是非曲直,只有宗派利益。
自然地,通通快递总公司内部派系冲突不断。最后老板痛下决心:在公司内部全面推行制度管理,用法治代替人治,以制定和实施“违规违纪量化考核制度”为突破口,力争用一年左右的时间让总公司恢复到正常秩序。
量化考核,说得轻巧,面对这一大帮在总公司横着走路的“皇亲国戚”、“元勋功臣”,以往那些靠评估打分混饭吃的考核方式,多半只能傻眼了,指标设定得再好,谁去评估?谁敢去摸老虎的屁股?
事实上,面对每天多如牛毛的违法乱纪现象,总公司也曾出台过非常严厉的处罚规定,对违规违纪行为予以重罚,但效果近乎为零。
博弈论分析:
在通通快递总公司违规违纪量化考核制度设计中,如果以“山头”作为考核单位,则博弈主体有三方:管理层、看重经济收入的第一类“山头”(如运营部、财务部等)和强调宗族荣誉的第二类“山头”(如信息中心、客服部等)。
和许多企业的情况类似,当公司管理层对违规违纪行为高度重视时,在大会小会上反复敲打,甚至开展专项整治活动,各“山头”就会表现出较高的自律性;可一旦风头过去,放松监管,违纪违规行为便会抬头。三方的博弈矩阵具体如下(这里为便于读者理解,直接对各方收益简单赋值,实际情况复杂得多)。
这个博弈的均衡结果,会出乎许多人的意外,那就是:通过人为努力去抓违规违纪,时间一长,管理层放弃努力,各部门放松自律。
为了遏制违规违纪行为的发生,管理层需要付出很大努力,耗费许多时间和精力,以争取管理秩序的好转,但这种努力不是无限的,会在耗费与收益相等的时候停下来,此时净收益为零;
而被监管者在高压严管之下,不得不严格自律,既不自在也不舒服,净收益为负,自然能偷懒则偷懒;只要管理层懈怠,各部门就会放松自律,甚至有可能从违规违纪中获益。所以最终形成的博弈均衡,必然是(低努力,低自律)。
这也正说明:靠人为努力去抓违规违纪,只能是一阵风接一阵风地刮,可再强健的老虎也有困倦的候,“常抓不懈”听上去很有气魄,其实不过是一种主观凌驾于客观之上的美好愿望。
怎么样才能打破困局呢?改变游戏规则,用制度去解决。为了使博弈均衡自动转向期望状态——管理层低努力、各部门高自律,可以在博弈各方的收益上做文章,譬如授予宗族荣誉、进行经济惩罚等。
先来看单独采用授予宗族荣誉的手段能否奏效,即:
看重经济收入的部门,对经济惩罚敏感,假定反应系数为2,而对宗族荣誉的反应系数为1;强调宗族荣誉的部门则倒过来,对宗族荣誉敏感,假定反应系数为2,而对经济惩罚的反应系数为1。不难算出,要使博弈均衡从(低努力,低自律)转向(低努力,高自律),转化条件为:x>6,即宗族荣誉所带来的收益要大于6。显然,这个条件实现起来非常困难。
单一手段难以奏效,考虑到博弈涉及到多方,利益取向各不同,那就双管齐下,即在宗族荣誉之外,再加入经济惩罚手段,即有:
由此可以算出,x>0,y≥3,即宗族荣誉带来的收益要大于0,经济奖惩造成的损失要大于等于3,就能使博弈均衡转向(低努力,高自律)。这个条件实现起来相对容易一些。
据此,可以进一步优化通通快递总公司违规违纪量化考核制度的基本思路:
“各山头的违规违纪事件数量每月递减,递减速度低于要求的,每低于当月考核指标1%,山头奖金总额增加2%,每高于当月指标1%,山头奖金总额扣减1%,以此类推。”同时还要再加上宗族荣誉激励,“遵纪守法优秀的山头,老板包戏班子到其村里唱大戏,以示荣耀。”
也许有人会问:为什么要“奖二罚一”?因为模型分析结果表明,经济惩罚力度合理取值范围是:y≥3,即违规违纪事件发生率每高于考核指标1%,奖金总额扣减比例应大于等于3%,而模型中“罚3%”与“奖2%、罚1%”是等效的。
之所以采用后一种方案,乃是因为,对于员工而言,“奖是意外之财、罚是剜肉之痛”,奖罚不对等,奖高于罚,这样的奖惩安排,员工心理上更容易接受一些。
也许有人还问:为什么在经济奖惩之外,年终还要对优秀“山头”予以精神奖励?因为博弈分析表明,要使均衡转向(低努力,高自律),x>0,即宗族荣誉带来的收益须大于0。
那么,是不是说,宗族荣誉越多越好,经济惩罚越严越好?也即x、y可以无限大?也不是。如何确保制度的控制参量(如经济奖惩力度)不会超出合理范围?如何确保博弈结构不会发生崩盘?要解决这个问题,靠博弈论自身是无能为力的,必须换个视角,把博弈各方视为一个系统整体,用系统论的方法来解决,譬如系统动力学分析。
作者:戴天宇,北大汇丰商学院教授、中国企业管理制度设计学创始人。