数据分析Python

Python Pandas 做数据分析之玩转 Excel 报表分

2020-09-02  本文已影响0人  you的日常

在开始之前我推荐大家下载使用 Anaconda,里面包含了 Spyder 和 Jupyter Notebook 等集成工具。到百度搜索一下就可以找到官方下载链接,下载个人版就可以(本文使用的 Python 版本为 3.7 ,只要大家用的是 Python 3,那么语法就和文中几乎没有差异)。

一、数据的读取

在工作中,实验数据和工作表格通常存储在 Excel 的文件中。也有人使用数据库,数据库本身自带简单的求和、计数等功能。如果做深入的数据分析,就离不开像 Python Pandas、TensorFlow 等专业工具了。数据库导出的数据文件通常为 CSV、UNL 格式。CSV 和 UNL 格式数据也可以用 Excel 打开并正常显示为表格,它们是使用特殊分隔符(比如 ,|;)的文本型数据文件。用 UltraEdit 之类的纯文本编辑器打开的样子是这样的:

csv文件文本编辑器查看

1.1 读取 CSV 文件

read_csv 是 Pandas 读取 CSV 文件时使用的方法。

import pandas as pd     #首先引入pandas包,并称它为pd
fpath=r'e:\tj\zt1802\car.csv'      #定义文件所在的位置
     df=pd.read_csv(fpath,header=0,index_col=None,encoding='gbk')     #read_csv读取数据

上一篇下一篇

猜你喜欢

热点阅读