《智能时代》读书摘要——吴军

2019-10-16  本文已影响0人  无限延伸的三角

《智能时代》——吴军

1、 好的模型和数据相吻合。

2、 有了模型之后,第二步要找到模型的参数,以便让模型至少和以前观察到的数据相吻合。——今天它有一个时

髦的词叫机器学习。

3、 将人的大脑当做信息源,从思考到找到合适的语句说出来是一个编码的过程,最后听话人把它听懂,是一个解

码的过程。(通信问题,用两个数学模型(马尔科夫模型)分别描述信源和信道)

4、 李开复:基于统计的犯法开展他的博士论文工作,最终和洪小文一起构建世界上第一个大词汇量、非特定人、

连续语音识别系统。(数据驱动)

5、 两派:一是模仿人;二是倡导数据驱动

6、 大数据 big data:1、体量大、维度大、全面性和完备性

7、 解决问题的思路:

1) 根据网页确定哪些用户在Google问过的复杂问题可以回答,哪些回答不了

2) 把问题和网页中的每一句话一一匹配,挑出那些可能是答案的片段,至于怎么挑,要靠机器学习了。

3) 利用自然语言处理技术,把答案的片段合成一个完整的段落。

8、 工业革命是机械思维的结果。

9、 用不确定性这种眼光看待世界,再用信息消除不确定性,不仅能够赚钱,而且能够把很多智能型问题转化成信

息处理问题。

10、 大数据的科学基础是信息论,它的本质就是利用信息消除不确定性。

11、 加入Google的决定并不难做,因为全世界的数据都在Google那里。

12、 微软的搜索引擎在很长的时间里做不过Google的主要原因并不在于算法本身,而是因为缺乏数据。

13、 从大量数据中挖掘相关性,直接用于产品,因此它们给外界的感觉是产品更新非常快。

14、 大数据与商业:

1) 种植大麻的房子用电模式和一般居家是不同的

2) 偷税漏税

3) 对怀孕顾客行为的分析——利用大数据精准地做生意

4) 该做酒吧的酒驾,装上可以测量重量的传感器,以及无源的射频识别芯片RFID的读写器,然后再在每个酒瓶上

贴上一个RFID芯片。这样,哪一瓶酒在什么时候被动过,倾倒了多少酒都会被记录下来,并且和每一笔交易匹配上。

5) Prada的试衣间,有一个屏幕,能够让顾客从各个方位“看到”自己试穿上一件衣服或戴上围巾、皮具的效果。

6) GE将WiFi装到它的冰箱和其他大型家电商,用来提醒用户更换冰箱取水器的滤芯等消耗性材料

15、 Google的优势在于它有足够的数据和计算能力用“笨办法”把每一种搜索事先试一遍,而这一点大部分公司做

不到。——穷举法

16、 现有产业+大数据=新产业

现有产业+机器智能=新产业

17、 为什么大数据的拐点会发生在今天?

18、 大数据来源是:电脑本身、传感器、将那些过去已经存在的、以非数字化形式存储的信息数字化

19、 Google花32亿收购nest公司?是为了获得数据。

20、 真正高明的公司都会像微软、苹果和Google那样采用曲线救国的方法。有些时候,为了收集数据,这个弯需要

绕的特别大。

21、 为了收集数据,先推出一个类似玩具的语音识别系统Google-411.

22、 数据存储和数据安全 protocol buffer.

23、 Google 为了解决问题,设计了dremel的工具,专门针对日志、数据库等大数据,解决实时访问和简单的数据处

理的问题。

24、 Google的突破在于找到一种方法,可以将一个很大的模型上百万参数同时训练的问题,简化为能够分布到上万

台(甚至更多)服务器上的小问题,这样使得大型人工神经网络训练成为可能。

25、 算法需要稳定

26、 有经验的IT系统主管和架构设计师都知道要尽量将敏感信息放到不同的地方,以免多种敏感数据同时丢失。

27、 MIT 利用大数据分析来防范黑客攻击,要比传统的在防火墙设置各种规则的做法有效5倍。

28、 Nest这样的智能家居可以知道家里每个人的活动,甚至知道什么人来访。

29、 利用用户的隐私赚钱

30、 怎样保护隐私呢?1)双向监视

31、 以色列的农业 滴灌技术

32、 2012年 Google科学比赛中第一名授予了一个高中生,对760万个乳腺癌患者的样本数据的机器学习,设计了一

种确定乳腺癌癌细胞位置的算法来帮助医生对病人进行活检,其位置预测的准确率高达96%。

33、 利用大数据寻找个性化药品的研究工作

34、 发明基因编辑技术而获得突破奖  多德娜、卡彭特尔

35、 在历次技术革命中,一个人、一家企业,甚至一个国家,可以选择的道路只要两条:要么加入浪潮,成为前2%

的人,要么观望徘徊,被淘汰。

上一篇下一篇

猜你喜欢

热点阅读