经济、管理和创业类互联网科技每天写1000字

你被大数据了么?

2016-08-20  本文已影响112人  立哥行

  我手机上常用的是某C浏览器。平时用它看网页、看文章、购物什么,大部分的应用都是用它了。看网页时,偶尔页面下面会跳出一些广告,一般是跳出来就关了也没注意。有阵子我写论文,经常用手机查相关的一些书和文章。某一天突然发现,浏览器下面跳出来的页面广告,都和我最近看的那些资料有关系。如果广告吃的或者穿的,那也不奇怪。但哪个商家无聊会发关于论文的比较偏门的超级小众的广告啊。于是,我明白了,我被大数据了。

  网络上每天产生巨量的数据,这些数据有多巨量呢?2013年左右统计的数据是:一天之中,互联网产生的全部内容可以刻满1.7亿张DVD,收发的电子邮件有近3000亿封(相当于美国两年的纸质信件数量);发出的论坛帖子达200万条(相当于《时代》杂志770年的文字量)。并且数据量每年以40%左右的速度递增。2013年后的三年,也就是2016年,数据量应该又增加了2,7倍。麦肯锡全球研究所给出的定义是:大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。

  如此巨量的数据,埋藏着丰富的信息。如果你要装修,你会常在网络上浏览关于装修的帖子,并搜索相关的关键字。如果家里有孩子,你会关注幼儿论坛,会参与论坛互动,会在购物网站上购买儿童用品。不同年龄的人会喜欢不同的歌手,会搜不同的歌。不同工作领域的人,会在网上关注不同的话题。这些个人传播的数据都带有明显的个人特征。你使用的数据会透露出,你的家庭状况是够富有,你有没有车,你住在哪里等等。这些信息流会带着你个人的印记,在网络上传播。根据你的长期的访问数据和传播数据,分析专家可以为你画一幅个人数据画像:男,40岁左右,去年买房,车是别克英朗XT的,住在湖边小区,毕业于清华大学中文系,在海滨区BCD大楼工作,从事IT工作,孩子四岁......而我的某C浏览器,应该就是记录了我最近的浏览关键字,主动向我推送我关心的资料。大数据泄露了我们个人的不少隐私。我们都被“大数据”了。

  但另一方面,大数据也帮助我们解决了许多问题。例如,2008年谷歌推出了流感预测功能。因为在生病流感的时候,很多人会在谷歌搜索一些特定的词汇关键字,查找一些特定的资料。当这些信息在某些地区出现的频度突然增加时,就表示有流感爆发的可能性。谷歌根据这些信息,通过一定算法处理数据并推出了流感预测功能。在2009年,谷歌工程师发布了论文,确认谷歌流感预测功能极为成功,流感爆发区域可以具体到特定的小地区,并且比医疗部门的统计数据更及时。对大数据中信息的挖掘作用非常大,可以帮助企业了解客户的需求实现精准营销;优化生产和营销流程从而降低全社会的成本;改善我们的生活(例如刚才说的流感统计帮助医生防治疾病,或者实时路况帮助我们出行);改善社会安全(监测犯罪和恐怖主义的行为,曝光犯罪行为)等等。

  大数据是一把双刃剑,但这是一个时代的问题。我们不再通过空气用说话来传递消息,不再通过笔和纸联系。我们通过电信号,通过0和1的电平来获取和发出信息。这些信息必须被储存后,才能被接受和发送。网络需要被管理,我们的信息按照预先设定的线路被储存,传送,储存,传送。并且我们在日常生活中越来越离不开网络了。我们快速得获得大量的信息的同时,也留下了大量的痕迹。

  凡走过,必留下痕迹,凡获得,必付出代价。大数据前所未有的运算能力带给了我们不可思议的发现、创新,并推动着我们生活质量的进步。但这种能力也给我们的法律、伦理及社会规范发起了挑战。如同核能,大数据也是科技成果之一,一样都可能成为双刃剑。如何使用,在于人类的智慧。

上一篇 下一篇

猜你喜欢

热点阅读