ThoughtWorks数据智能读书雷达
学习和分享都是存在于ThoughtWorks基因里的东西,这几年ThoughtWorks陆陆续续推出了多个版本的《读书雷达》,有的专注产品创新,有的专注软件开发,还有关注社会公益领域的内容。通过这样的方式给这些领域分享我们的学习方法和总结,也为对这些领域感兴趣的人提供一些从快速入门到进阶的指导。
ThoughtWorks数据智能事业部自三年前成立以来,就致力于将ThoughtWorks在敏捷软件开发、精益数字化产品创新等工作方法与数据智能领域的成熟实践结合,为客户解决新形势下如何实现数据驱动的智能企业的问题,为行业带来创新的解决数据问题的方法和实践总结。
这版《数据智能读书雷达》由ThoughtWorks数据智能事业部的同事们自发组织完成的,是大家修炼和实践的总结。我们希望将之作为数据智能事业部三年的一些沉淀,为即将进入数据领域工作的毕业生们、正计划将数据智能作为转型方向的个人以及企业内部新成立的急需快速成长的数据团队,提供了一份数据智能领域的快速成长指南。
我们根据实现智能企业的不同阶段划分了四个主题:
- 数据智能战略规划
- 数据智能平台建设
- 数据工程
- 数据科学及智能应用
考虑到读者数据智能认知会处在不同的阶段,我们把每个主题分为三个等级,分别为基础、进阶和高级。在雷达图中,读者可以根据该书在图中距离圆心的远近,判断它的难度级别。我们还使用了不同的图示来表达对每本书的倾向性意见,其中,三角形图示代表“强烈推荐”,圆形图示代表“推荐”。我们希望这类书籍对于个人而言,可以根据自己目前的水平,选择适合自己的书籍。
这里是《数据智能读书雷达》的豆列。
image推荐语
由于书目较多、文章篇幅受限,这里无法把所有提名者写的推荐语一一罗列,仅挑选出各象限中“强烈推荐”的书目推荐语,供读者参考,其余书目的推荐语详见豆列评语。
- 数据智能战略规划
2.《麦肯锡工作法》
3.《金字塔原理》
4.《智能商业》
5.《精益企业》
在构建软件产品中,面对不断变化的市场环境、客户期望和不断出现的新技术,企业如何应对,本书给出了很好的解答。
7.《智能革命》
8.《大数据大创新》
9.《原则》
本书和作者瑞·达利欧都已经名声在外,盖茨和张瑞敏的顶力推荐。瑞·达利欧在本书中分享的生活和工作原则,帮助他从一个普通中产阶级家庭的孩子成长为这个时代最成功的人士之一。达利欧的原则不一定每一条都适用每一个人,但在此为基础,构建自己的原则,是必须要做的事情,作者给出了构建原则的方法。
10.《值得信赖的顾问》
顾问的最高境界,是成为客户心中无可替代的人。专业技能的差距相对容易弥补,但信任的建立确实是难上加难。书中讲述了大量的故事、经验和实例,既有成功的,也有失败的;既有作者亲身经历的,也有旁观目睹的。好好读一下,对每一位励志成为资深顾问的同仁一定会有帮助。
- 数据智能平台建设
11.《Hadoop应用架构》
12.《大数据日知录》
DataOps为数据类项目的持续交付提供了方法支撑。这本书是业界第一本系统讲解DataOps的书籍,它从介绍DataOps宣言、什么是DataOps开始,又阐述了DataOps对不同角色的影响,最后有几个案例。如果你有持续交付的基础,很容易理解书里的内容,它不过是这个方法在Data领域的实践。
14.《大数据之路》
17.《数据中台》
这是一部系统讲解数据中台建设、管理与运营的著作,旨在帮助企业将数据转化为生产力,实现数字化和数智化转型,此书章节连贯比较系统,推荐给数字/智化转型的专业服务人员和企业中带领转型的践行者们。
18.《算法与数据中台》
19.《平台革命》
20.《架构即未来》
- 数据工程
21.《数据仓库》
数据仓库之父Inmon的经典力作,是数据仓库核心概念和方法的最全面的介绍。它介绍了用于设计数仓系统的基础组件,多种数仓策略,以及用于加载索引和管理数据的技术。本书是传统数据仓库系统的入门之选。
22.《数据架构》
本书系统地介绍了流式处理中面临各种问题和解决方案。包括流式处理和批处理的比较,处理乱序数据的原则和实践,保证数据准确性的处理技术等等。不管是设计流式系统,还是使用流式处理工具,都值得阅读本书。
24.《敏捷分析》
25.《精益数据分析》
26.《数据仓库工具箱》
论述维度建模技术、模式和实践的经典之作,包括了详尽的理论基础和真实世界中的复杂案例,是数据建模不可多得的参考书。
27.《Building a Scalable Data Warehouse with Data Vault 2.0》
28.《Hadoop权威指南》
29.《Kafka权威指南》
30.《Spark权威指南》
- 数据科学及智能应用
32.《大数据智能》
34.《数据挖掘导论》
35.《机器学习》
机器学习这本书,很早作为教材一样的经典推荐给学者,书中没有酷炫的故事,只有清晰的推理,从传统机器学习的相关算法,到深度学习的各个算法,书中都涵盖了具体的算法逻辑,正如其名,机器学习的相关算法,在这本书都可以看到。
36.《机器学习实战》
入门必备书籍,介绍从事数据科学和机器学习必备的基础技能。也是Tensorflow认证的推荐学习书籍。
37.《用户画像》
38.《赤裸裸的统计学》
39.《深度学习推荐系统》
全书脉络清晰,通俗易懂,作者站在工业实践角度介绍了一些非常实用的相关知识,如特征工程、实时性、优化目标、评估、冷启动等,特别适合对如何将推荐算法实践落地没有头绪的读者。
40.《联邦学习》
42.《深度学习》
本书是深度学习圣经般的指导书籍。较为系统的讲解了深度学习的算法原理,包含了非常细节的公式推导,仔细研究将可以帮助我们夯实基础。本书覆盖了当时的大部分深度学习模型,包括卷积神经网络,序列神经网络,自编码器,生成模型等内容。