【闲聊】交互的麻烦
我有段时间想在游戏写一个AI,包含简单的自我学习,后来发现查了相关资料,发现处理起来相当麻烦。以人与人之间的交互行为为例,每个人能够发起的行为其实是有一个决策树的,而决策树又基于一定的行为模式。交互行为模式是建立人与人之间的相互认知上的。
对于甲乙两人来说,以甲为例,甲知道的事情为集合A,乙知道的事情为集合B,那么从上帝视角来看,甲对乙的信息优势有A&~B
,但是实际的情况并不是这样。因为甲实际上不知道B的情况,甲认为的乙知道的事情为B'(和B有些许差异),这导致甲自我认知中的信息差为A&~(B')
,所以实际的信息优势应该修正为A&~(B|B')
。人总是会主动去寻求扩大自己的信息优势,除了扩大自己的认知,同时扩大对他人的认知,同时甚至降低他人对自己的认知。如果甲是一个学习智能,那学习中除了A的增长,还必须包含B'的增长,以及C'、D'等等模型的增长,以趋近于B、C、D,甚至在权衡利弊的情况下,通过对图灵机说谎来降低A'的值。
“有人记住了你的回答”
甲对于乙的认知一般从陌生人开始,但是B'一般不从0开始建立,因为我们都知道有常识(包含潜规则)这种东西,我们一般称之为Common knowledge(强共识,公开共识),即甲乙都知道的事情,并且甲乙知道另一方知道这件事;如果存在丙,那还包括甲知道<乙知道丙知道>这件事,以此类推。B'就从常识和后天建立的了解组成。
如果发生了一件事件,所有人非交流性学习(目击,倾听,复杂教育)的话,那么称之为Mutual knowledge(弱共识,沉默共识),即所有人都知道这件事,但不知道其他人知道与否,(比如经典的囚徒困境,皇帝的新装),个人知识一般就由强弱共识和后天独自经历组成。弱共识只要通过交流即可进行转换为强共识。我们平时日常上的考试,检查大家的对知识的掌握情况,就是指的是把弱共识变成强共识。
但无论如何,强弱共识都属于常识,只要交流就能获取;如果是独自经历的部分,就没有办法通过简单的交流来达到共识。
“这个人说话怎么这么讨人厌”
假如你在一个聊天群里暗示了自己的待遇不佳时,有人直球问你的待遇如何,你会本能的感到十分不悦。从表面上看是对私人信息侵犯,但实际上是他在尝试把弱共识变成强共识,因此让你变得很不爽。因为在你卖惨以后,其他人是不能完全判断你的待遇如何的,可能你的待遇还不错,只是来装逼的。但是如果你的回复从暗示到明示的话,那你的情况就变成了强共识。你的信息优势会变减弱,从生物学上来说你会变得危险,因此你会做一些出于自我保护的应激反应。
我们也一般把没什么常识的人称为不成熟的人,所以越是不成熟的陌生人,就越难相处。所以在群里问别人待遇的人也会被其他人本能地排斥,因为他让人感觉比较有侵略性,假设我是B,因为他没什么常识所以集合B'小(我所认知的),导致A&~(B')
很大,所以他的决策树(我所认知的)要比其他人要大,直觉上推断其行为难以预测。简单来说,我们会比较警惕陌生人和学习能力很差的人。
难以接触的高人
上面我们总结了A&~(B')
越大,决策树就越复杂,那别忘了其中还有一个参数A,所以我们实际上不仅会远离学习能力差的人,我们还会远离学习能力强的人。把一个普通人放到大佬群里面,刚开始基于不了解的情况还能插科打诨,但是随着相互接触的时间越长,普通人的决策树基本上就会逐渐趋近于0,而大佬的决策树就在他面前变得越来越大,对于普通人基本上就是处于完全恐惧和焦虑的状态,这属于生物学上的避开强大的同类竞争。所以想要和大佬接触,要么就保持一定的距离,要么就得在大佬的知识盲区(是正确的盲区,而不是你认为大佬的盲区)有所建树,才能有交往的前提,否则从AI上来说,就是老死不相往来的情况。
皈依者狂热
如果我们对一个人的关系不是从陌生开始建立,而是从崇拜开始建立会如何?甲把乙当做一个全知全能的神,因此甲对乙的认知B'会从极大开始,因此甲对乙的行为就只有可能是对A的无尽索取(无论得不得到满足)。因为在甲的眼中,乙的行为树是基于(B')&~(A'')
,(A''表示甲认为的乙认为甲知道的东西),那除了崇拜的因素以外,如果甲越是自卑,那甲虔诚度就会越高。
我们不去考虑狂热崇拜之后的演化导向(读者可以自行分析),而转向这个样一个问题,如果获取一个信徒?很显然,首先甲如果只是一个普通人,那他就必须针对乙进行行为设计,让乙在甲的面前基本上无计可施。如果甲在不提高自己认知的情况下,第一就要让乙对甲的认知降到极低,甚至低于陌生人的地步。要做到这一步,那么就必须要打破强共识。所以甲可以通过设计展示、演说等一些方法颠覆乙的日常认知,把强共识重新变成乙的弱共识,甚至从乙的认知中移除。简单来说,就是把乙变成一个没有认知,低san的人。然后展示自己的大认知,大全能(撒谎,选择性展示),展示信息差,这样就容易产生皈依者效应。第二,展示信息差的行为必须要在短时间内完成,不给猎物逃跑的机会。如果是逐渐了解的情况,乙对甲的在初期认知所形成的早期决策树就就没那么容易减弱。一些行为模式就已经刻入并不断强化在人的神经元上了,长时间内都无法新陈代谢完毕,和童年阴影是一个道理。同时我们也可以明白,一个人的教育程度越低(强共识少),也就越容易受诱惑;受教育的程度越高,也就不容易有信仰。