数据分析-pandas库快速了解
2020-05-27 本文已影响0人
叶子陪你玩
1.pandas是什么库
Pandas是Python第三方库,提供高性能易用数据类型和分析工具,pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。
与numpy对比区别:
![](https://img.haomeiwen.com/i2783521/5a1793f9285c9f48.png!thumbnail)
2.pandas库怎么用
安装
pip install pandas
导入
import pandas as pd
3.pandas两个数据类型
两个数据类型:Series, DataFrame
Series类型
Series类型由一组数据及与之相关的数据索引组成
![](https://img.haomeiwen.com/i2783521/946c48e95fe383a9.png!thumbnail)
第一列的0,1,2,3是自动索引,第二列是实际数据值,最后的dtype表示数据类型
![](https://img.haomeiwen.com/i2783521/609c84b554d6c0a6.png!thumbnail)
Series类型数据的常见创建方式
python列表
![](https://img.haomeiwen.com/i2783521/9bbf9e17f921064a.png!thumbnail)
标量值
![](https://img.haomeiwen.com/i2783521/37967f6c29d7a836.png!thumbnail)
python字典
![](https://img.haomeiwen.com/i2783521/c896b620fc4af5c2.png!thumbnail)
ndarray
![](https://img.haomeiwen.com/i2783521/4ca29ca0ed30b64a.png!thumbnail)
Series类型数据的基本操作
获得索引和数据
![](https://img.haomeiwen.com/i2783521/bf255708373a5547.png!thumbnail)
更改索引
![](https://img.haomeiwen.com/i2783521/a092f6c1f3ae60bd.png!thumbnail)
索引
![](https://img.haomeiwen.com/i2783521/1cea50924cde87a8.png!thumbnail)
切片
![](https://img.haomeiwen.com/i2783521/0c68feebb22a4b09.png!thumbnail)
DataFrame类型
DataFrame类型由共用相同索引的一组列组成,是一个表格型的数据类型,每列值类型可以不同,既有行索引、也有列索引,常用于表达二维数据。
![](https://img.haomeiwen.com/i2783521/9a0ee4cde589cfab.png!thumbnail)
![](https://img.haomeiwen.com/i2783521/658b8d8fd8977490.png!thumbnail)
DataFrame类型数据的常见创建方式
二维ndarray对象
![](https://img.haomeiwen.com/i2783521/3b4170a0b13cca52.png!thumbnail)
一维ndarray、列表、字典、元组或Series构成的字典
![](https://img.haomeiwen.com/i2783521/c7ab4befb5915e7e.png!thumbnail)
![](https://img.haomeiwen.com/i2783521/92c2dda5f13d6fb5.png!thumbnail)
![](https://img.haomeiwen.com/i2783521/1888d1ec3348ad76.png!thumbnail)
DataFrame类型数据的基本操作
获得行列索引和数据
![](https://img.haomeiwen.com/i2783521/96db28abbba21738.png!thumbnail)
更改行列索引
![](https://img.haomeiwen.com/i2783521/67e82dde2e3d59aa.png!thumbnail)
选择数据
索引切片获取列数据和单个数据
![](https://img.haomeiwen.com/i2783521/7a931bc51a356d4a.png!thumbnail)
索引切片获取行数据
![](https://img.haomeiwen.com/i2783521/1f64719601b1504a.png!thumbnail)
iloc():按照索引的位置来选取,这里要注意这种方式是包含切片的末尾的数据的
![](https://img.haomeiwen.com/i2783521/ab88d1faa56fa5fa.png!thumbnail)
loc():按照索引index的值选取,如果没有自定义值,行数据也可以通过切片获取。
![](https://img.haomeiwen.com/i2783521/84893fd5ce1e0218.png!thumbnail)
![](https://img.haomeiwen.com/i2783521/3bc5086086e10e4d.png!thumbnail)
![](https://img.haomeiwen.com/i2783521/e6eaeca384e451c8.png!thumbnail)
4.查看数据
![](https://img.haomeiwen.com/i2783521/1d561a0daa4be14a.png!thumbnail)
5.文件数据读取和保存
保存
![](https://img.haomeiwen.com/i2783521/527e303e4095dad0.png!thumbnail)
读取
这里多了一列数据是因为上面写入时把索引写入了,可以再写入时去掉index,to_csv(file,index=False)
![](https://img.haomeiwen.com/i2783521/29fcc1d0e1d187d3.png!thumbnail)
限于篇幅原因,还有更多内容(空值处理,分组,合并,排序,删除等),这个会在后面的具体场景中应用。
(全文完)
长按二维码,加关注!叶子陪你玩
欢迎转载,转载请注明出处!
欢迎关注公众微信号:叶子陪你玩编程
分享自己的python学习之路