Garbage In, Garbage Out|如何用数据操纵无
周末刚撸完一堂叫《Calling Bullshit》的课程,2017年在华盛顿大学录制,当时无意中在推特看到,然后扫了一眼,觉得挺有意思:
其实我本人(ISTP) 比较理性思维,看东西基本抱怀疑态度,fact based 所以在这个龙蛇混杂的信息浮躁时代比较有优势;感觉真正区分人的不再是获取信息的能力,而是对信息的判断能力,不然只会一直被牵着鼻子走。
There is so much bullshit everywhere. We are drowning in bullshit.
当时第一时间分享了给身边的朋友看,还有助理;她说了一句:是的,有时候你让我去google, 我也不知道如何识别信息。
假如遇到同款疑问的,这门课就很有用了 。
课程大纲相关书籍也在预售中,预计今年8月4正式推出。
提到其实当代很多所谓的教育,初创公司文化,杂志等真的很bs, 真心赞成。
简单分享几个最经典的bullshit套路
1)Anything seems too good to be true 任何看起来太美好的东西
这个就最简单,例如其实任何投资都有风险,那么宣称只会赚还是包赚的那种真的呵呵了。
2)Unfair Comparisons 不公平的对比
最典型的例子,对比各国GDP,就很傻,敢不敢对比人均GDP?又或者拿最近各国的疫情情况做对比,但居然按感染人数占比当地国家人数百分比来作对比? 特傻。
毕竟不同国家的总人数很不一样,例如美国感染人数的确是高,但总人口也更多;比利时感染人数明显不多,但因为总人口少,所以反倒会得出比利时的情况更严峻?
3)还有一点:新闻自由度。
可能很多人不知道国外媒体是经常夸大事实逼政府办事的,嗯,不说了。
4)Correlation and Causation 相关性和偶然性
也学了一个很有意思的拉丁文:The fallacy of post hoc propter ergo hoc.(after this, therefore because of this)
后此谬误(the post hoc fallacy) 后此(post hoc)是“后此,所以因此”(post hoc,ergo propter hoc)的缩写。 它是从拉丁文翻译而来的,整个短语意思是:“在此之后,因而必然由此造成。
例如最常见的,不小心感冒,但吃了感冒药,过二天却发烧了,所以是这感冒药引起发烧的?(这个就是很简单的后此谬误)但事实上发烧可能是感冒本身造成,不一定是因为感冒药。
社会上很多人擅长将原本毫无关联的,却取巧地设计为看起来有关联,但只要再dig deeper就可以看出背后的猫腻了
5)Fake news 假新闻
感觉大部分人已经对假新闻见惯不怪了?也是现代社会的一种悲哀。
但估计以我读者的素质,也能看出中文圈的信息水平了,各种眼球经济,标题党为了获得更多的点击量,其实还有什么不敢写?
日常最多转发的各种#震惊体 #别国要沦陷了#大国要出手了,点击量还真的特别高;所以像我们这类客观冷静分析,说实话的感觉就不怎么受欢迎了。
但你看到的也是别人想让你看到的。不过感觉其实fake news也有一个好处:能大概帮你看出对方的信息搜索&判断能力,甚至帮你判断哪些人值得交朋友。
You are the average of the five people you spend the most time with. 我们的智商基本等于身边五位的平均值。
感觉现在尤其在社交媒体平台上转发的文章,大部分人的转发更多出于signalling,更多是表达自己站台支持哪方的观点,而不是出于真正的思考。
也分享一个最近刚学到的词汇:Micro-Propaganda Machine
文章这里举了美国选举和英国脱欧的例子,就是专门有机构制造传播情绪感染力强、充满偏见的造假新闻,还特别吸精的容易引起转发情绪的,不过这个就很多国家都有。
再假的新闻,假如身边的人都在传,其实会默默成真。
推荐一本书籍 :《1984》
也推荐一部好电影:The Great Hack
一句话总结:谁得到了数据,谁就能掌管一切。
6)Chart manipulation 引用表格更高级地大胆误导
这个更有意思,尽管是同一数据也能设计出不同的结果:
例如当年苹果发布会,原本销量平平无奇,但假如用累计数据来作图,那就可以出现了很性感的“explosive growth” (爆发性增长)
累计数据,当然一直在涨,因为不会降。
或通过设计不同的横坐标,可以完美误导一众吃瓜群众认为到底是哪个阶层付出更多税。
又或者近期的疫情中,通过设定横坐标中的底部时间段,也能轻松造出一种疫情在放缓的假信号,其实这个套路还蛮常见的。
想起@森淼之前发了很有意思的图:
再举一个例子,不同的拍摄角度也很有意思:
这不正如抖音,小红书里面很多同款美女?换个角度搭配滤镜加化妆品就能解决很多问题
那么在大数据时代,作为个体应该如何应对?
课程多次提到我们该时刻自省三大问题
Who is telling me this? 这是谁告诉我的?
How do they know it? 他们怎么知道的?
What’s in it for them? 和他们有什么相关利益?
再补充几招私人做法
1)控制信息源
其实我基本不会花时间看被投喂的信息流。
每年订阅了很多付费资讯,因为时间宝贵,看已经被我信任的人筛选过的资讯质量有保证;对书籍的挑选我也会先看别人总结的大纲,对味的再详细看;其实能花钱找到这些人帮我过滤,已经是一笔很值得的投资。
不过感觉国内大多人还没有付费订阅的习惯,感觉还是很多人不懂其实免费才是最贵的,毕竟看不懂的盈利模式才是最可怕的;例如很多美其名的免费软件,背后在倒卖用户数据。
2)多求真
很简单,多渠道对比消息。
我一般会溯源,也就是找到最原始的信息源对比查看;例如经常在微信会有人转发特朗普的推,太夸张表述的话,我会特地去看是不是真的有这条推。。
我只信任一手资讯,不然就好像小时候玩的传声游戏,传着传着整个故事就变味了。
也不要轻易传播没有fact check过的新闻。
3)提高个人判断力
多结交能给你带来不同观点的朋友,时常保持思考与清醒;多看书。
4)时刻保护个人数据 data is the new oil.
其实这个在自家知识星球已经分享了很多实用工具了,欢迎上船。
说到最后
实不相瞒,我现在已经不看任何新闻了,连手机上的脸书也删了。
只看长期有价值的东西:历史,哲学,人生类;然后找到各行业最top的人学习,感觉其它基本是不值得浪费精力的noise.
精力放在哪里真的很决定认知水平,可惜绝大部分人就是很容易被奶头乐引诱。
所以说在大数据时代,控制一个人更容易了。
Stay tuned for more.
更多往期文章:
☕️ 关于本文作者:nataliamok.com
擅长:地理套利,从事海外规划
数字游民,连续创业者:theinsure.co