了解你所有信息的大数据,你了解吗?
文 / 董小琳
我们可以将时代划分为:有大数据之前 和 有大数据之后。
为什么要这么分?
因为,谁也不能忽视,大数据对我们每个人生活方方面面的影响。
比如说:
之前,你的日子过得好不好,恐怕除了家里人,只有几个关系特别好的朋友知道。
甚至,在亲戚比较多的大家庭里,你还会特意为某次聚会做准备,就是为了:别让亲戚看扁了。
现在,你的一切生活状况,都被互联网、大数据收集得一干二净。
今天买包花了多少钱,明天预售,你又用了几个红包抵尾款,平台都了解得一清二楚。
甚至,就连你对比过几样商品,中途退出过几次,是因为价格问题,还是性能不满意,那些掌握数据的陌生人,同样都知道。
这是一个细思极恐的问题。
一个你根本不认识的人,对你的生活习惯,消费水平了如指掌。到底有多可怕?
据传,打车软件的算法,会根据你以往的消费记录,调整出一个你能接受的最高价格。
怎么理解?
比如你之前走这趟路,最多花过20块。那么,今天它会把价格加到25。如果这时你退出了,下次它会调整到22。直到让你觉得,虽然贵了点,但是还可以接受为止。
然后,下次在这个基础上,继续试探你的极限。
这……
不是说大数据是时代进步的标志吗?怎么会这样?!
不妨我们今天就来读一本,为了揭开大数据真相而创作的作品——《算法霸权》。
这本书的作者是数据科学家,凯西·奥尼尔。
从小,凯西就喜欢盯着车流,把一个个的车牌数字,因式分解成素数相乘,并以此为乐。对数学深深着迷的她,后来有了博士学位,成为了巴纳德学院的终身教授。再后来,成为了华尔街的金融工程师,银行的风险分析师,以及旅游网站的用户分析师。
最后,凯西成为了本书作者,专门揭露大数据对美国社会生活的霸权影响。
在这本书中,我们能看到被鼓吹上天的大数据,在实际应用中,是如何引入不公,带来歧视,甚至成为了某些特权阶级的统治工具。
作者将这种工具成为——数学杀伤性武器,而我们,则就此沦为了数字难民。
数据到底有什么错?
说到数据、算法,你可能会觉得,比单纯人的主观判断更公平、精准。
至少,计算机是没有感情和偏见的。
因此,通过计算得出的结论,更有说服力。
的确,算法和数据的优势是客观精准,这些都没有问题。
那为什么作者说,大数据会带来偏见与不公呢?
原因就出在:
无害的算法和数据,被人类利用了。
那么,人类是如何干扰数据和算法的呢?
作者主要给出了两个方面,分别是:
模型算法的制定
对结果的判断和执行
我们先来看第一点:算法,都是工程师写的。
就拿书中讲到的,华盛顿特区对中学教师的评估模型来说。
萨拉的教学质量,在学校里有口皆碑。因此,她对自己的评估结果,很有信心。
可是,就在新一年的评估算法中,增加了将近一半的权重,不是来自学校领导、社区家长们的评价,而是用当年学生的考试成绩来评估。
结果,萨拉的排名一落千丈。
最终的结果是,她不仅不再是优秀教师,而且因为评估不达标,被强制解聘了。
用学生的成绩来评估老师,听起来无可厚非。
但,这又是一个细思极恐的问题。
首先,一个班的学生最多也就是30多人,样本数量严重不符合大数据的要求。
其次,在萨拉被解聘很久以后,《华盛顿邮报》对那一届学生的考卷做了一次深入调查,发现大量学生的卷子上,有涂擦痕迹。
什么意思?
就是说,有人为了好成绩,而集体作弊。
那,我们能拿着这些证据去找算法说理吗?
明显不能。
“客观”的算法,很难考虑到这些“意外”情况。
我们因为无法理解算法的复杂,而无法对其给出的分数,提出质疑或者抗议。
而且,执行算法结果的,也是那些有执行权利的人们。
因此,客观的数据在人类主观意志的操纵下,已经失去了原有的优势。
还有药可救吗?
这么说,大数据就真的是杀伤性武器,而要坚决抵制吗?
作者说,不是的。
毕竟大数据是这个时代的新生事物,在发展的过程中出现问题,也是常理。
针对大数据应用的改进,书中给出了几点建议:
首先,增强监管手段;
其次,提升开发工程师的职业操守;
最后,还要保证数据的透明公开。
这样,才能化杀伤性武器为发展工具,让更多的人能从中获益。
比如——
你是否在领英上,找到了合适的工作?
你是否在音乐平台的推荐里,听到了心仪的歌曲?
又或者,你是否是婚恋网站的会员,在系统红娘的帮助下,找到了人生伴侣?
面对新事物,我们不能因噎废食,更不能盲目乐观。
那么,在和大数据相处的这段日子里,你又有过怎样的经历呢?
欢迎留言。
—END—
不是在读书,就是在码字的小琳
如果喜欢这篇文章,不妨点击下方红心咯~