陈峰《大数据介绍》笔记

2020-03-14  本文已影响0人  Loving_myself

作为互联网转型专家,陈峰教授介绍了大数据的一些基本框架,对入门很有帮助。

. 大数据基本概念

大数据的基础源自互联网--> 大数据-->云计算-->人工智能

1. 数据大:TB到PB。今天Baidu一天产生1千亿张A4纸,相当于可以从地球到月球。

2. 数据多:以前主要事交易数据,比如我买了瓶水;现在还包括交互数据,比如我给你发了个表情。因为机器识别语言的能力越来越强,使得搜索引擎转向推荐引擎,计算机可以预测你感兴趣的内容。

3. 数据快:产生快和处理快(处理了,没有数据的拥堵,不会死机)一部高清电影下载,4G是按分钟,5G是按秒计算。

4. 精准高:数据最大的好处是没有主观性;但是今天数据收集的方法有问题,而且之间没有逻辑,所以容易篡改。数据获取必须是即时性的,数据之间必须要有逻辑

. 大数据的来源

大数据的管理包括

1. 数据来源

2. 如何挖掘分析

3. 如何应用

各种APP,大平台现在争的不是钱,是时间。比如马云收购饿了吗,通过饿了吗得到数据,比如某处中午点水饺的特别多,在这个附件建一个水饺店。形成整合。美团收购mobile,为的是2个多亿用户数据,8700万月活跃数据,美团把这些数据赋能于美团商家。

大数据的来源包括

1. 智能化的产品:连接,传感

2. 人员巡查(政府,企业为最大需求方,互联网为最大服务商)

所以社会将来需要的是又懂技术,又懂项目的通才,使得数据得到合理的利用

. 大数据的的分析

3个步骤/方法:

1. 应用主题是什么?应用点在哪里?

2. 如何构建数据模型?需要看出数据之间的逻辑关系 (中弹飞机例子:一般人想到的是加固那个中了弹的地方,其实应该加固没有中弹的地方,因为所以这个地方够坚固,其它都没有飞回来)

3. 最后运用在什么地方?怎么变现?1)内部运用(比如民政发现理论从2002年开始由9月变成7月,后来发现是高考改革:6月考,马上就知道分数;中国离婚是因为小孩子,所以把沟通从家庭氛围到夫妻沟通;2)外部运用;3)相关运用

目前的应用包括

1. 定位功能(物联网定位,定位追踪)

2. 识别(ID,手机号,支付密码)最近发了量子卫星来尝试新的密码方式

3. 画像(刷脸)

4. 匹配。 以前靠抽样生产:比如只能生产39-42码鞋,现在通过3D打印机可以生产刚好符合的鞋,一个礼拜后鞋子送到你脚下

5. 优化(高德地图:怎么去规划不同的路线,最近还是最快,单车开车)

. 大数据的的巨大变革

1. 思维变革 (今天中国:因果论;大数据:未知变成确定-->不是因果关系,是相关关系)

1) 因果关系转为相关关系(啤酒和尿不湿:放到一起后,销售增加了100%)(飓风,第二天蛋挞就一抢而空)

2) 产权关系转为共享关系

3) 交易关系转为共享关系

2. 商业变革

1) 竞争的是时间(再也不是地段或流量)(e.g.抖音,王者荣耀)

2) 传统:供应链-->现在:价值链(企业:你能够真正获取到多少你的用户)-->定制化

3. 管理变革

1) 经验数据(个人魅力)转为大数据的管理

2)处理转为预防 (高德:7500万用户,根据路线判断是否会出现拥堵)

上一篇下一篇

猜你喜欢

热点阅读