【闲聊】交互的麻烦

2020-10-27 本文已影响0人游学者夏纳

我有段时间想在游戏写一个AI，包含简单的自我学习，后来发现查了相关资料，发现处理起来相当麻烦。以人与人之间的交互行为为例，每个人能够发起的行为其实是有一个决策树的，而决策树又基于一定的行为模式。交互行为模式是建立人与人之间的相互认知上的。

对于甲乙两人来说，以甲为例，甲知道的事情为集合A，乙知道的事情为集合B，那么从上帝视角来看，甲对乙的信息优势有A&~B，但是实际的情况并不是这样。因为甲实际上不知道B的情况，甲认为的乙知道的事情为B'（和B有些许差异），这导致甲自我认知中的信息差为A&~(B')，所以实际的信息优势应该修正为A&~(B|B')。人总是会主动去寻求扩大自己的信息优势，除了扩大自己的认知，同时扩大对他人的认知，同时甚至降低他人对自己的认知。如果甲是一个学习智能，那学习中除了A的增长，还必须包含B'的增长，以及C'、D'等等模型的增长，以趋近于B、C、D，甚至在权衡利弊的情况下，通过对图灵机说谎来降低A'的值。

“有人记住了你的回答”

甲对于乙的认知一般从陌生人开始，但是B'一般不从0开始建立，因为我们都知道有常识（包含潜规则）这种东西，我们一般称之为Common knowledge（强共识，公开共识），即甲乙都知道的事情，并且甲乙知道另一方知道这件事；如果存在丙，那还包括甲知道<乙知道丙知道>这件事，以此类推。B'就从常识和后天建立的了解组成。
如果发生了一件事件，所有人非交流性学习（目击，倾听，复杂教育）的话，那么称之为Mutual knowledge（弱共识，沉默共识），即所有人都知道这件事，但不知道其他人知道与否，（比如经典的囚徒困境，皇帝的新装），个人知识一般就由强弱共识和后天独自经历组成。弱共识只要通过交流即可进行转换为强共识。我们平时日常上的考试，检查大家的对知识的掌握情况，就是指的是把弱共识变成强共识。
但无论如何，强弱共识都属于常识，只要交流就能获取；如果是独自经历的部分，就没有办法通过简单的交流来达到共识。

“这个人说话怎么这么讨人厌”

假如你在一个聊天群里暗示了自己的待遇不佳时，有人直球问你的待遇如何，你会本能的感到十分不悦。从表面上看是对私人信息侵犯，但实际上是他在尝试把弱共识变成强共识，因此让你变得很不爽。因为在你卖惨以后，其他人是不能完全判断你的待遇如何的，可能你的待遇还不错，只是来装逼的。但是如果你的回复从暗示到明示的话，那你的情况就变成了强共识。你的信息优势会变减弱，从生物学上来说你会变得危险，因此你会做一些出于自我保护的应激反应。
我们也一般把没什么常识的人称为不成熟的人，所以越是不成熟的陌生人，就越难相处。所以在群里问别人待遇的人也会被其他人本能地排斥，因为他让人感觉比较有侵略性，假设我是B，因为他没什么常识所以集合B'小（我所认知的），导致A&~(B')很大，所以他的决策树（我所认知的）要比其他人要大，直觉上推断其行为难以预测。简单来说，我们会比较警惕陌生人和学习能力很差的人。

难以接触的高人

上面我们总结了A&~(B')越大，决策树就越复杂，那别忘了其中还有一个参数A，所以我们实际上不仅会远离学习能力差的人，我们还会远离学习能力强的人。把一个普通人放到大佬群里面，刚开始基于不了解的情况还能插科打诨，但是随着相互接触的时间越长，普通人的决策树基本上就会逐渐趋近于0，而大佬的决策树就在他面前变得越来越大，对于普通人基本上就是处于完全恐惧和焦虑的状态，这属于生物学上的避开强大的同类竞争。所以想要和大佬接触，要么就保持一定的距离，要么就得在大佬的知识盲区（是正确的盲区，而不是你认为大佬的盲区）有所建树，才能有交往的前提，否则从AI上来说，就是老死不相往来的情况。

皈依者狂热

如果我们对一个人的关系不是从陌生开始建立，而是从崇拜开始建立会如何？甲把乙当做一个全知全能的神，因此甲对乙的认知B'会从极大开始，因此甲对乙的行为就只有可能是对A的无尽索取（无论得不得到满足）。因为在甲的眼中，乙的行为树是基于(B')&~(A'')，（A''表示甲认为的乙认为甲知道的东西），那除了崇拜的因素以外，如果甲越是自卑，那甲虔诚度就会越高。

我们不去考虑狂热崇拜之后的演化导向（读者可以自行分析），而转向这个样一个问题，如果获取一个信徒？很显然，首先甲如果只是一个普通人，那他就必须针对乙进行行为设计，让乙在甲的面前基本上无计可施。如果甲在不提高自己认知的情况下，第一就要让乙对甲的认知降到极低，甚至低于陌生人的地步。要做到这一步，那么就必须要打破强共识。所以甲可以通过设计展示、演说等一些方法颠覆乙的日常认知，把强共识重新变成乙的弱共识，甚至从乙的认知中移除。简单来说，就是把乙变成一个没有认知，低san的人。然后展示自己的大认知，大全能（撒谎，选择性展示），展示信息差，这样就容易产生皈依者效应。第二，展示信息差的行为必须要在短时间内完成，不给猎物逃跑的机会。如果是逐渐了解的情况，乙对甲的在初期认知所形成的早期决策树就就没那么容易减弱。一些行为模式就已经刻入并不断强化在人的神经元上了，长时间内都无法新陈代谢完毕，和童年阴影是一个道理。同时我们也可以明白，一个人的教育程度越低（强共识少），也就越容易受诱惑；受教育的程度越高，也就不容易有信仰。

【闲聊】交互的麻烦

“有人记住了你的回答”

“这个人说话怎么这么讨人厌”

难以接触的高人

皈依者狂热

猜你喜欢

热点阅读