职场小白入门数据分析的科学之旅
最近小编粉了一款智能学英语的App,根据发音、做题准确率等信息,每天智能推送相应学习课程,再根据你每天使用App的频率与时长,科学安排课程的复习时间,小编称之为AI(人工智能)老师。
简单来说,AI老师就是聚集了大量英语学习者的资料,每天根据新学习者的学习结果匹配相应的课程与复习安排,此处背后的原理就是经常被大家谈论的“大数据”。
近年来,大数据逐渐充斥在生活的各个角落,愈来愈多的小伙伴开始对数据分析这一行业产生兴趣,关于数据分析的书籍、课程等资料也是五花八门,我们应该怎么抉择自己的大数据之旅呢?这里,小编为大家筛选制定了适合入门大数据的学习路线,因为制定合理的学习路线可以让学习过程高效率且思路清楚,起到事半功倍的效果。
今天DataHunter数猎哥就来带大家迈入深不可测的大数据之门。
一、明确数据分析学习目标
首先我们需要明确自己的学习目标—自己的职业发展方向是怎样的?
数据分析这一行主要有两个职业方向,其中一个是业务方向,需要在懂公司业务的基础上,通过数据发现公司问题,并给予分析,如数据产品经理、数据分析师,此类职业对技术要求并不那么高;另一个是技术方向,需要懂得数据挖掘、算法等,对技术的要求就相对较高了。
但无论今后你要从事业务方向或者技术方向,今天讲的入门技巧都是从事数据分析工作必备技能。
概括来说,数据分析的学习主要内容分为理论知识的学习和工具技能两方面的学习。理论知识的学习又分为统计学、数据分析方法论、和数据分析思维三个方面;而数据工具技能对于入门的小白来说也基本需要具备的,首先要学会Excel和SQL,学好这两个就足够应对工作中80%的问题了。最后当然工具会得越多越好,后续还需要根据工作内容学习Python等。
二、数据分析理论的学习
1.统计学
加州大学伯克利分校迈克尔·乔丹教授指出的:没有系统的数据科学作为指导的大数据研究,就如同不利用工程科学的知识来建造桥梁,很多桥梁可能会坍塌,并带来严重的后果。可见统计学是数据分析的灵魂,因此掌握数据分析的统计学基础知识是成为一名优秀数据分析师的基础。
统计学作为数据分析的理论和依据,科学引导数据分析,使分析过程系统化。大不列颠百科全书对统计学有个定义,说这是一门收集数据、分析数据的科学和艺术。其中把信息和规律从数据中提取出来是收集数据的过程;研究数据之间的因果关系,找出最优化分析方案,这就是分析数据的过程。所以说从指导性意义上来讲,学习数据分析,首先要先学统计学。
推荐书目,《赤裸裸的统计学》
本书用生活有趣的案例、直观的图表揭开了统计学、大数据和数字的“神秘面纱”,让读者知道权威期刊、媒体新闻、民意调研中公布的数字从何而来,轻松掌握判断这些统计数字“是否在撒谎”的秘籍。最重要的是不会让零基础的大家看起来太枯燥。
2.数据分析方法论
统计学负责收集数据、找到数据的因果关系,而数据分析方法论则确保数据分析结构的体系化。在统计学基础上,给收集到的数据资料制定数据分析的前期规划,指导着后期数据分析工作的进展,比如主要从哪几方面开展数据分析,各方面包含什么内容和指标?常用的分析方法有对比分析、交叉分析、相关分析、回归分析、聚类分析等,使分析结果的具有有效性及正确性。
推荐书目《谁说菜鸟不会数据分析》
此书基于通用的Excel工具,加上必知必会的数据分析概念,并且采用通俗易懂的讲解方式。此书努力将数据分析写成像小说一样通俗易懂,分别讲解数据分析必知必会的知识、数据处理技巧、数据展现的技术、通过专业化的视角来提升图表之美、数据分析报告的技能以及持续的修炼,形式活泼,内容丰富而且充实,让人有不断阅读下去的动力。读者完全可以把这此书当小说来阅读,对于刚入门的新人来说易上手。
3.数据分析思维
利用统计学和数据分析方法进行的数据分析都是为了解决或者预测某一问题,执行工作者最重要的是思维,业务结果怎么样,哪里有问题,怎么去解决,解决方法是什么,其次利用数据分析来发现问题、解决问题。
小白入门需要掌握的数据分析思维可包括:结构化思维,即任何事情都可以归纳出中心论点,每个一级论点又可以衍生出其他的分论点;假说演绎思维,即从想得到的结果出发,反推什么样的条件可能会产生什么样的结果;指标化思维,即一种定量分析思维,指标就是用来定义、评价和衡量业务的一个标准;维度分析思维,即从不同维度去分析数据,维度是观察数据的不同角度,例如时间、地点等。
推荐书目《金字塔原理》
原理的构建基于金字塔结构,且简洁的文字使读者更易理解,深入细致地把握思维的环节,书中列举了许多实例,介绍了如何在解决问题过程中的不同阶段使用多种框架来组织分析过程,使读者的思维在实际上进行了预先组织,从而能够更方便地应用金字塔原理。本书他能够教会你思考、表达、和解决问题的逻辑。
具备了数据分析的思维,制备了数学分析的方案,接下来就是如何将方案落实到行动中去。
三、数据分析工具技能的学习
1.Excel
Excel经历微软接近20年的研发,解放了大量的劳动力,工作效率提高的绝对不止一点半点,excel的功能强大到你想不到,大多数人会excel的1%就已经足够办公使用了。对于数据分析来说,excel是最最最基本的数据分析工具了,这里需要说的是一定要边学边练习,不然繁多的功能将很容易遗忘。
推荐书目:《Excel教科书》
本书的作者是日本知名的Excel业务改善咨询师吉田拳,在50家以上的公司开展Excel操作培训,指导过2000名以上的职场人士。本书系统地呈现了作者多年的实战经验和教学经验,能够让你在最短的时间内获得最实用的Excel操作技巧。只要掌握7个要点,9个功能,6大基础函数,懂得如何利用函数组合,做到效率高、不出错,基础的数据分析技能就get到了。
2.SQL数据库语言
DT时代,数据正在呈指数级的速度增长。Excel对十万条以内的数据处理起来没有问题,但现在稍微成功一点的产品,其数据都是百万起,这时候就需要学习数据库。
说起数据库,你可以不会R,不会python,但是你不能不会SQL,基本每个数据分析岗都需要会SQL。越来越多的产品和运营岗位,将会SQL作为优先的加分项。
SQL是数据分析的核心技能之一,从Excel到SQL是数据处理效率的一大进步。SQL的学习主要就是简单查询、关联查询、函数引用,初入门阶段,只需了解常用的数据库类型,即能够在现有的表格里面查询出数据,能够更新数据对数据进行重编码,知道怎么增加添加数据,把数据变得规整就行。数据库主要的查询语言有where、group by、order by、having、like、count、sum、min、max、distinct、if、join、left join、limit、and和or的逻辑,时间转换函数等。
推荐书目:《SQL必知必会》
本书没有涉及理论,而是从实践出发,由浅入深地讲解了广大读者所必需的SQL知识,适用于各种主流数据库。实例丰富,便于查阅。本书涉及不同平台上数据的排序、过滤和分组,以及表、视图、联结、子查询、游标、存储过程和触发器等内容,通过本书读者可以系统地学习到SQL的知识和方法。
3.Python
SQL无法满足工作需要时,那么就该派Python出场了。2010年,python被TIOBE编程语言排行榜评为年度语言。
Python 是一门有条理的和强大的面向对象的程序设计语言,类似于Perl, Ruby, Scheme, Java。现在流行的AI人工智能技术大部分都是用Python语言编写的,Python为我们提供了非常完善的基础代码库,覆盖了网络、文件、GUI、数据库、文本等大量内容,被形象地称作“内置电池”,大量开发好的的第三方库,可以直接使用。
推荐书目《父与子的编程之旅》
本书是一本家长与孩子共同学习编程的入门书。作者是一对父子,他们以Python语言为例,详尽细致地介绍了Python如何安装、字符串和操作符等程序设计的基本概念,介绍了条件语句、函数、模块等进阶内容,最后讲解了用Python实现游戏编程。书中的语言生动活泼,叙述简单明了。为了让学习者觉得编程有趣,本书编排了很多卡通人物及场景对话,让学习者在轻松愉快之中跨入计算机编程的大门,经调查本书是小白最能看得进去的python书。
小编呕心沥血找来的书单(以上推荐)对大家超级友好,内容编排科学且生动有趣。自学一门课,靠学习收集来的零散干货不如听一听系统的相关课程,而系统的相关课不如钻研几本书。虽说大多数人认为最好的自学方法还是多看书,但是每人的学习脾性不同,比如小编就会更喜欢听老师讲课,因此下面为大家推荐几个小编认为相当友好的自学网站。
四、自学网站
1.中国大学MOOC
https://www.icourse163.org/
MOOC是Massive Open Online Course(大规模在线开放课程)的缩写,是一种任何人都能免费注册使用的在线教育模式。MOOC有一套类似于线下课程的作业评估体系和考核方式。每门课程定期开课,整个学习过程包括多个环节:观看视频、参与讨论、提交作业,穿插课程的提问和终极考试。
2.学堂在线
https://next.xuetangx.com/
学堂在线是清华大学于2013年10月发起建立的慕课平台,是教育部在线教育研究中心的研究交流和成果应用平台,学堂在线运行了来自清华大学、北京大学、复旦大学、中国科技大学,以及麻省理工学院、斯坦福大学、加州大学伯克利分校等国内外一流大学的超过2300门优质课程,覆盖13大学科门类。
3.我要自学网
https://www.51zxw.net/
我要自学网成立于2007年6月7日,是由佛山市丰智胜教育咨询服务有限公司倾力打造的在线实用技能学习平台,专业从事软件视频教程开发的教育服务机构。开发团队由奋战在教学第一线的专业培训师组成,网站内的视频均采用职业培训授课资料,教学方法及进度,面向广大的电脑爱好者,视频均由经验丰富的在职老师原创录制。
网站目前涵盖教程分类有”电脑办公”、"平面设计"、"室内设计"、"室外设计"、"影视动画"、"机械设计"、"工业自动化"、"程序开发"、 "网页设计"、"会计课程"等几百套专业软件视频教程,满足大家对于学习的更多需求。
4.Coursera
https://www.coursera.org/
Coursera 是由斯坦福大学两位计算机教授创办的在线教育平台,其中一位是一位美籍华人,Coursera 上现有28个不同国家和地区的145所不同的大学,课程算是比较多的,而且好多课程提供中英文字幕,在国内的多个平台可以观看Coursera 的课程。而且Coursera 还提供科学的方法来教学,提供随机生成的测试,让学生反复学习和测试,直到其掌握所学知识。
五、小结
数学分析的思维有啦,科学制定数学分析的方案也有啦,如果再具备怎么落实到行动中的技能,那小伙伴们就算入门数据分析啦。Anyway,要学的东西很多,即使进阶到入门级别也需要花费很多精力与时间,因此,路要一步一步走,饭要一口一口吃,首先要确定好自己的职业规划,反推回来需要什么样的技能。数据分析虽然深不可测,但是相信大家也一定能掌握和熟练的运用。
更多干货内容,欢迎关注公众号:DataHunter
-数据分析展示就用 DataHunter-
关于 DataHunter
DataHunter 是一家专业的数据分析和商业智能服务提供商,注册于2014年。团队核心成员来自 IBM、Oracle、SAP 等知名公司,深耕大数据分析领域,具有十余年丰富的企业服务经验。
DataHunter 旗下核心产品智能数据分析平台Data Analytics、数据大屏设计配置工具Data MAX已在业内形成自己的独特优势,并在各行业积累了众多标杆客户和成功案例。
成立以来,DataHunter就致力于为客户提供实时、高效、智能的数据分析展示解决方案,帮助企业查看分析数据并改进业务,成为最值得信赖的数据业务公司。