读书大数据书香哏都

了解你所有信息的大数据,你了解吗?

2018-11-01  本文已影响30人  职心眼儿

 文 / 董小琳

我们可以将时代划分为:有大数据之前 和 有大数据之后。

为什么要这么分?

因为,谁也不能忽视,大数据对我们每个人生活方方面面的影响。

比如说:

之前,你的日子过得好不好,恐怕除了家里人,只有几个关系特别好的朋友知道。

甚至,在亲戚比较多的大家庭里,你还会特意为某次聚会做准备,就是为了:别让亲戚看扁了。

现在,你的一切生活状况,都被互联网、大数据收集得一干二净。

今天买包花了多少钱,明天预售,你又用了几个红包抵尾款,平台都了解得一清二楚。

甚至,就连你对比过几样商品,中途退出过几次,是因为价格问题,还是性能不满意,那些掌握数据的陌生人,同样都知道。

这是一个细思极恐的问题。

一个你根本不认识的人,对你的生活习惯,消费水平了如指掌。到底有多可怕?

据传,打车软件的算法,会根据你以往的消费记录,调整出一个你能接受的最高价格。

怎么理解?

比如你之前走这趟路,最多花过20块。那么,今天它会把价格加到25。如果这时你退出了,下次它会调整到22。直到让你觉得,虽然贵了点,但是还可以接受为止。

然后,下次在这个基础上,继续试探你的极限。

这……

不是说大数据是时代进步的标志吗?怎么会这样?!

不妨我们今天就来读一本,为了揭开大数据真相而创作的作品——《算法霸权》。

这本书的作者是数据科学家,凯西·奥尼尔。

从小,凯西就喜欢盯着车流,把一个个的车牌数字,因式分解成素数相乘,并以此为乐。对数学深深着迷的她,后来有了博士学位,成为了巴纳德学院的终身教授。再后来,成为了华尔街的金融工程师,银行的风险分析师,以及旅游网站的用户分析师。

最后,凯西成为了本书作者,专门揭露大数据对美国社会生活的霸权影响。

在这本书中,我们能看到被鼓吹上天的大数据,在实际应用中,是如何引入不公,带来歧视,甚至成为了某些特权阶级的统治工具。

作者将这种工具成为——数学杀伤性武器,而我们,则就此沦为了数字难民。

数据到底有什么错?

说到数据、算法,你可能会觉得,比单纯人的主观判断更公平、精准。

至少,计算机是没有感情和偏见的。

因此,通过计算得出的结论,更有说服力。

的确,算法和数据的优势是客观精准,这些都没有问题。

那为什么作者说,大数据会带来偏见与不公呢?

原因就出在:

无害的算法和数据,被人类利用了。

那么,人类是如何干扰数据和算法的呢?

作者主要给出了两个方面,分别是:

模型算法的制定

对结果的判断和执行

我们先来看第一点:算法,都是工程师写的。

就拿书中讲到的,华盛顿特区对中学教师的评估模型来说。

萨拉的教学质量,在学校里有口皆碑。因此,她对自己的评估结果,很有信心。

可是,就在新一年的评估算法中,增加了将近一半的权重,不是来自学校领导、社区家长们的评价,而是用当年学生的考试成绩来评估。

结果,萨拉的排名一落千丈。

最终的结果是,她不仅不再是优秀教师,而且因为评估不达标,被强制解聘了。

用学生的成绩来评估老师,听起来无可厚非。

但,这又是一个细思极恐的问题。

首先,一个班的学生最多也就是30多人,样本数量严重不符合大数据的要求。

其次,在萨拉被解聘很久以后,《华盛顿邮报》对那一届学生的考卷做了一次深入调查,发现大量学生的卷子上,有涂擦痕迹。

什么意思?

就是说,有人为了好成绩,而集体作弊。

那,我们能拿着这些证据去找算法说理吗?

明显不能。

“客观”的算法,很难考虑到这些“意外”情况。

我们因为无法理解算法的复杂,而无法对其给出的分数,提出质疑或者抗议。

而且,执行算法结果的,也是那些有执行权利的人们。

因此,客观的数据在人类主观意志的操纵下,已经失去了原有的优势。

还有药可救吗?

这么说,大数据就真的是杀伤性武器,而要坚决抵制吗?

作者说,不是的。

毕竟大数据是这个时代的新生事物,在发展的过程中出现问题,也是常理。

针对大数据应用的改进,书中给出了几点建议:

首先,增强监管手段;

其次,提升开发工程师的职业操守;

最后,还要保证数据的透明公开。

这样,才能化杀伤性武器为发展工具,让更多的人能从中获益。

比如——

你是否在领英上,找到了合适的工作?

你是否在音乐平台的推荐里,听到了心仪的歌曲?

又或者,你是否是婚恋网站的会员,在系统红娘的帮助下,找到了人生伴侣?

面对新事物,我们不能因噎废食,更不能盲目乐观。

那么,在和大数据相处的这段日子里,你又有过怎样的经历呢?

欢迎留言。

—END—

不是在读书,就是在码字的小琳

如果喜欢这篇文章,不妨点击下方红心咯~

上一篇下一篇

猜你喜欢

热点阅读