囚徒困境和帕累托最优
2017-08-14 本文已影响0人
木头的随笔
“囚徒困境”是1950年美国兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。两个共谋犯罪的人被关入监狱,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确实,二者都判刑八年。由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。最终导致纳什均衡仅落在非合作点上的博弈模型——囚徒困境的百度解释。
囚徒困境之所以成立是因为他建立在绝对的条件下,没有其他因素起作用,比如威胁、感情等等。下面我们分析一下。
如果两人都不招供是什么情况,说明囚徒坚信另外一个囚徒不会招供,或者不担心对方招供后我的代价。人都是趋利避害的,显然这个假设不会成立。
那一个招供一个不招供是什么情况,说明不招供的人非常仗义,经济学中假设人都是理性的,显然也是与经济学不符的。
两个人都招供的情况是每个囚徒在自己看来自己已经做到了帕累托最优,只不过两个人的决定放到一起对他们来说就不是帕累托最优了,此时反而对警方来说是帕累托最优。
自评:谈不上文章,这段时间每期作业都是在理解一个概念,也谈不上有结构和格式。
如果懂经济学请评论我对概念的理解的是否有偏差,如果不懂请随便评论点啥吧。