python数据分析
2017-05-30 本文已影响0人
鬼宇书生
利用python进行数据分析需要使用的工具
- pandas :数据分析处理库
- numpy:科学计算库库
- matplotlib :数据可视化库
使用anaconda 安装python 环境
可参考:
致Python初学者们 - Anaconda入门使用指南
左手程序员,右手作家:你必须会的Jupyter Notebook
Numpy库学习
可参考《利用python进行数据分析》第四章
- 数组操作
代码演示:
![](https://img.haomeiwen.com/i3225209/c21d918331111086.png)
2.矩阵基本操作
代码演示:
![](https://img.haomeiwen.com/i3225209/8bba1ff0c5b5f373.png)
3.矩阵的创建与初始化
代码演示:
![](https://img.haomeiwen.com/i3225209/07b5f81a0b889f44.png)
4.常用函数案例演示
代码演示:
![](https://img.haomeiwen.com/i3225209/8507fdd8b021a8d7.png)
5.排序与索引
代码演示:
![](https://img.haomeiwen.com/i3225209/094e4124e2ade54c.png)
6.用numpy 解决实际问题
![](https://img.haomeiwen.com/i3225209/79f83480add0cd3c.png)
pandas数据分析库
1.数据读取与显示
代码显示:
![](https://img.haomeiwen.com/i3225209/e01d077ddc85dbaf.png)
2.数值计算与排序
代码显示:
![](https://img.haomeiwen.com/i3225209/53961f55178540d1.png)
3.数据预处理与透视表
利用泰然尼克号数据
代码显示:
![](https://img.haomeiwen.com/i3225209/c19e6c73844f022a.png)
4.series数据
![](https://img.haomeiwen.com/i3225209/fa5af6a6a1a9f470.png)
5.数据索引变换
![](https://img.haomeiwen.com/i3225209/3fee420748c93efd.png)
matplotlib库:
- 折线图
代码展示:
![](https://img.haomeiwen.com/i3225209/d776be43ced7a96d.png)
2.条形图与散点图
![](https://img.haomeiwen.com/i3225209/33304ee0a289d780.png)
3.直方图和四分图
![](https://img.haomeiwen.com/i3225209/b89b99ddc1a08444.png)
4.可视化案例
![](https://img.haomeiwen.com/i3225209/b3a354a012e41e77.png)
5.可视化细节
要选择实用的颜色,避免色弱人群看不清
![](https://img.haomeiwen.com/i3225209/36b42e8e5b7e0091.png)
![](https://img.haomeiwen.com/i3225209/ce4429f5c1c167ad.png)