Pandas 文件操作
2020-04-14 本文已影响0人
学人工智能的菜菜
pandas 文件格式数据处理
read_csv:从文件,url,文件类型对象中加载带分割符的数据,默认分隔符为逗号
read_table:从文件、url、文件型对象中加载带分隔符的数据,默认分割符号为制表符‘\t’
read_fwf:读取固定款列格式的数据
read_clipboard:读取剪切板中的数据,可以看做是read_table的剪切板,可以用在将网页中的数据转换为表格中数据时用到
pd.read_csv('data.csv')#默认会把第一行作为头部
out:
a b c d e
0 1 2 3 4 5
1 6 7 8 9 10
pd.read_table('data.csv',sep=',')#默认会把第一行作为头部
out:
a b c d e
0 1 2 3 4 5
1 6 7 8 9 10
pd.read_csv('data.csv',header=None)#没有头部,所有文件里的数据都是目标数据,它会自动给你生成头
out:
0 1 2 3 4
0 a b c d e
1 1 2 3 4 5
2 6 7 8 9 10
#指定索引
pd.read_csv('data.csv',index_col='c')#指定c列为索引列
out:
a b d e
c
3 1 2 4 5
8 6 7 9 10
a = pd.read_csv('data.csv',index_col=['c','d'])#指定c,d列为索引列
a
out:
a b e
c d
3 4 1 2 5
8 9 6 7 10
pd.read_csv('data1.csv')#文件中的NaN代表的就是空
out:
a b c d message data
0 1 2 3 4 5 NaN
1 hello 6 7 8 9 world
2 NaN hi 10 11 12 14
pd.read_csv('data1.csv',skiprows=[1])#不读取哪一行,这里表示不读第一行
out:
a b c d message data
0 hello 6 7 8 9 world
1 NaN hi 10 11 12 14
#找出空的
data = pd.read_csv('data1.csv')
data.isnull()
out:
a b c d message data
0 False False False False False True
1 False False False False False False
2 True False False False False False
#指定读取,一般是指大文件
pd.read_csv('data1.csv',nrows=5) #指定读取五行
out:
a b c d message data
0 1 2 3 4 5 NaN
1 hello 6 7 8 9 world
2 NaN hi 10 11 12 14
data =pd.read_csv('data1.csv',nrows=5) #指定读取五行
data.to_csv('data2.csv',sep='|')
out:
image.png
读取excel
excel = pd.read_excel('data_excel.xlsx')
p1 = excel.plot(kind='scatter',x='age',y='place').get_figure()
# p1.savefig('1.png') 把画图的图保存为图片