《周易》消息与大数据
在展开正式讨论前,请读者看一张图:
图一:《周易》的十二消息卦
上述图中,乾、夬、大壮,……,一直到坤,总共有十二个卦,在《周易》中,又称为“十二消息卦”,“消”是退、减的意思,“息”是长、增的意思。在实际应用中,人们用“十二消息卦”代表一年的十二个月,其中,乾卦代表四月(农历),姤卦代表五月,依次类推,坤卦代表十月。
不知道读者有没有发现这样一个情况:在事物的表象处于某种极端状态时,其反面的情形已经开始萌芽了。比如,十一月是仲冬,是气候非常寒冷的时候,十一月在《周易》是复卦,复卦的初爻是阳爻,一阳(温暖的因素)已经发生了;五月是仲夏,是气候比较炎热的时候,五月在《周易》是姤卦,姤卦的初爻是阴爻,一阴(寒冷的因素)已经发生了。阴极阳生,寒冷到一定程度,温暖的因素就已经发生了;阳极阴生,炎热到一定程度,寒冷的因素就已经发生了。这类情形与大多数人的经验感知是有一定出入的,在我们的经验感知中,五月只有炎热,十一月只有寒冷。
实际上,人体的经验和五官是会骗人的(《楞严经·耳根圆通章》就是讲人的五官如何骗人的,^_^),耳听为虚,眼见的也不一定为实,建立在经验感知上的感性认识不一定正确,还需要借助理性思维去校验。最近,网络上流传一个笑话,即中金公司对2018年中国经济的十大预测,其中九个半是错误的。其实,很多经济学家对宏观经济的预测大多是不靠谱的,因为他们预测的基础是社会经济的表象数据,就像上面说的,光看五月份的气候和温度,再加上“好上加好”的思维惯性,是得不出“寒冷的因素已经发生了”这一结论的。
笔者借用《周易》十二消息卦和中金2018年预测失误的例子,就是想和读者探讨预测的特点和规律。管理学家赫伯特·西蒙说:“管理就是决策”,而决策的前奏就是对未来形势变化的预测,只有方向对了,才有可能做正确的选择。预测是根据今天来推测明天,根据“此”的情形来推测“彼”的情形,预测的逻辑或规律主要有三类:因果、辩证和相关(相对的因果)。
因果律就是假如有A,就一定有B,A是B的必要充分条件,A是因,B是果,A与B之间的关系就是因果关系,这种关系具有一致性、普遍性,适用的是演绎逻辑。可大卫·休谟等经验主义学派否定事物之间有绝对的因果关系存在,比如,打雷了不一定会下雨,种子埋在土壤后也不一定会发芽,等等,所以事物之间的因果关系只能是偶然的,适用的是归纳逻辑,归纳逻辑就有概率大小的问题。佛学的因果论也认为世间诸法(事物)是缘起性空,是因缘和合的产物,因是影响事物发展变化的主要因素,又称内因;缘是影响事物发展变化的次要因素,又称外因。比如种子可能会发芽,是内因;种子发芽,需要土壤、水分和空气,是外因。
在现实自然和社会中,任何事物的发展变化,内因和外因缺一不可,因此,经验界或现象界的事物之间只能是相对的因果关系,是或然性,或概率性的,只适用于归纳逻辑,这就是现实世界中的相对因果律,或称事物之间的发展变化可能具有相关性,至于相关性的强弱,取决于人类对外因的掌控程度;比如,大棚蔬菜就是人们在反季节时通过人工模仿出的气候来诱发蔬菜的生长。
在西方哲学中,辩证规律或逻辑是黑格尔提出的。黑格尔认为,“存在(Being)”当中蕴含其反面的“非存在(Non-being)”,“存在”在其发展变化中,就是不断向“非存在”的转化过程。黑格尔用植物的苞、花、果之间的变化来阐释其辩证逻辑。其实,《周易》对辩证规律或逻辑的阐述更为形象和彻底。《周易》中的每一个卦都是由阴阳爻来组成(乾卦虽然表面上没有阴爻,但有“用九”爻,以平衡其他六阳爻;坤卦虽然表面上没有阳爻,但有“用六”爻,以平衡其他六阴爻),每一个卦都有与之相对的错卦,阴阳之间互根转化,对立统一,讲的就是事物发展变化的辩证规律。
在《周易》看来,事物的辩证发展是必然的、普遍的。如果把A+和A-代表事物A的两种对立情形,A+和A-只是同一事物或本体A的一体两面,是相同本质事物A的不同表象。就好比,夏天和冬天是两种截然不同的气候,但其实它们都表示了同一个天地,是同一天地在不同时间上的不同反映,随着时间推移,夏天向冬天发展;反之,冬天也在向夏天发展;这种转化,周而复始,循环往复。用辩证规律去看待宏观经济,有经济发展的波峰,就必然有经济发展的波谷,只不过因为人们厌恶波谷,有时会采用人为手段,以推迟反面情形的到来,就好比中国政府2008年推出的四万亿,并没有本质上改变中国经济的深层次内涵,只是将经济的寒冬人为地推迟到2018年。这种人为推迟谈不上绝对的好坏,关键还是要看当事人的首要选择是什么;如果当事人更想要稳定,那就创造条件去维持稳定,其他的则是次要的;如果当事人想要变革,那就不惜代价去进行变革,其他的也是次要的。
除了辩证律,事物或情形之间还可能遵循因果律或相关率,大数据预测背后的主要逻辑是相关律,或者说相对的因果律,寻找的是不同中的相同,下图二是大数据预测的基本逻辑。
图二:大数据预测的基本逻辑
在图二中,假设A和B是不同的主体,他们分别有各自的属性(Property)及行动/行为(Action/Behavior)。主体A和主体B具有相同的属性3,主体A在具备属性3后作出了行动3;在这里,属性3就是触发主体A之行动3的条件;因此,大数据推测主体B也具有作出行动3的可能性(可能性选择);在企业管理实践中,就可以根据企业的价值诉求,去主动利用或迎合主体B之可能性行为3。当然,实际的大数据预测要比这个复杂得多,但基本原理类似。
大数据之“大”,不仅仅指数据的体量或数量大,更指的是针对客体的数据更及时、更全面、颗粒度更细。在事物的因果关系中,往往是多个原因才可能导致一个结果,仅凭单个原因来推测其结果的成功概率则比较低,由多种因来推测其结果的成功概率则比较大;因而,大数据预测的价值,在于利用更及时、更全面、颗粒度更细的数据,来提高因果性预测的概率,概率越大,因果性预测的结果就越准。
在企业管理实践中,要想提高大数据预测的准确性,主要方法有两个:一是优化事物之间因果关系的模型质量,模型质量越高,因和果之间的因果关系更准确,就可以通过少量的因来推测出一个可信的果;二是对事物的属性和行为打上尽可能多的标签,标签越多,掌握的因的种类也越多,就可以通过多个因来推测一个可信的果。方法一的改进主要依赖于算法,对很多企业而言,则比较难借鉴,毕竟,优秀的算法人才或数学科学家是稀缺品;方法二的改进主要依赖于数据采集的广度和细度、数据的可信度、标签的种类和数量,等等,对很多企业而言,技术门槛不高,值得效仿和借鉴。
事物之间的相对因果关系,或者说相关性,在消费等商业大数据领域比较低,在制造等工业大数据领域则比较高。毕竟,商业领域牵涉的范围太广,很多外部条件或影响因素不是单个企业可以掌控的,因而,商业领域大数据预测的准确性比较低。在制造等工业领域,事物发展变化的外因大都可以为企业所控制,因而,工业领域大数据预测的准确性相对比较高;实际上,企业的产品质量保证等工作也必须在高相关性和准确性下才有可能。
从另一个角度来说,对物之性,比如加工工艺、材料硬度和刚性,等等的因果性预测比较好做,因为物性的突发性、偶然性变化比较小,受认识主体的影响也比较小;对人之性,比如消费者的购买行为、员工对企业的认可度,等等的因果性预测比较难做,因为人性的变化具有很大的突发性和偶然性,且与认识主体之间是双向互动,相互影响的。简言之,利用大数据技术,对物之性的因果性预测,其准确度一般都比较高,比如工业大数据领域;对于人之性的因果性预测,其准确度一般都比较低,比如消费大数据领域。
为了应对商业领域因果预测所存在(准确度不高)的问题,消费大数据预测有一个倾向,那就是从消费者的偏好(Preference)预测转变为对消费者的个性(Individuality)预侧。大数据预测认为,每个人都有其独特的存在,根据群体行为特征来预测个体行为特征比较难,但根据个体“昨天”的行为来推测其“明天”的行为则比较容易。根据个性,对单个消费者的行为特征来进行预测,其基础数据支撑是消费者画像(Customer Persona),即通过全局唯一的消费者ID,将消费者的属性和行为进行标签化和画像,而移动互联网等技术的应用,使得企业对消费者的画像成为可能。下图三是消费者画像的示意图。
图三:消费者画像的示意
事物或情形之间的因果律和辩证律,虽然有很多类似之处,比如都有不同情形发展变化的先后关系,但两者的影响方式和程度是不同的。因果律指的是不同事物之间的因果关系,或者同一事物的不同情形之间的因果关系;而辩证律则主要指同一事物的不同情形之间的正反转化,其表现形式上是因果,但实质是质变上的正反。
事物或情形之间的因果律,具体到某个事物,或者在短时间内,其因果关系的概率是比较高的;涉及面越广,展望的时间周期越长,其因果关系的概率就越低;因此,在现实世界中,因果关系是相对的,具有或然性。而同一事物不同情形之间的辩证律,短期内是看不出来,也可能体验或感受不到其正反之间的转化,但放在足够长的时间周期内,其正反转化是必然的,普遍的。
通过大数据来预测,短期内,从经验或现象中,只能预测事物或情形之间的(相对)因果关系,无法或很难预测同一事物不同情形之间的正反转化。从这个意义来说,大数据的相关性或因果性预测,可以和《周易》的消息式辩证预测,起到相互补充的作用,短期看因果,中长期看辩证;微观看因果,宏观看辩证。
最后,笔者以中美关系为对象,应用《周易》消息式辩证规律,做个中长期宏观预测:如果说过去的20年,中美关系是合作中有竞争,合作是主旋律,竞争是副旋律;那么未来的20年,中美关系是竞争中有合作,竞争是主旋律,合作是副旋律。