【R】《R for Data Science》学习笔记-先导篇

2018-10-26  本文已影响20人  沈梦圆1993

本笔记是学习《R for Data Science》的个人总结笔记系列的先导篇,大概讲解一些会学到什么知识,不会讲什么,开始学习前应该具备哪些知识储备,仅供参考。

封面

关于这本书

这本书将教我们如何用R来做数据科学:学习如何将自己的数据导入R中,把它变成最有用的结构,转换,可视化并对数据进行建模。在这本书中,我们会学习数据科学需要实用技能。就像化学家学习如何清洁试管和储存实验室一样,我们将学会如何清洁数据,绘制绘图——还有许多其他的东西。这些技能使得数据科学得以发展,在这里我们可以用R找到最佳的解决方法,我们将学习如何使用图形语法、文字编程和可重复性研究来节省时间。还将学习如何在清洗整理、可视化和探索数据时管理认知资源。(翻译的有点烂,大概就是这个意思,让我们开始好好学习吧~)

要学什么

数据科学的范围很大,不可能通过这么一本书就能掌握的。通过这本书我们能够为使用绝大部分重要数据科学分析流程打下坚实的基础。很多数据科学分析流程大概就如下图:

[图片上传失败...(image-1c99d7-1540546570114)]

上面的六个步骤都离不开编程。数据科学家不需要态专业的编程技巧,但是学习一些基础的编程知识能够使得完成一些普通任务更加快速方便。学完这本书大概能掌握80%数据科学项目需要的技能,其余20%则需要依赖其他工具来完成(不会讲,但会给出学习资源)。

不会讲什么

学前准备

我的微信公众号

如果实在有需要请给我发邮件:mengyuanshen@126.com
也可以关注我的公众号:沈梦圆(PandaBiotrainee)

上一篇 下一篇

猜你喜欢

热点阅读