Pandas 文件操作

2020-04-14  本文已影响0人  学人工智能的菜菜

pandas 文件格式数据处理

read_csv:从文件,url,文件类型对象中加载带分割符的数据,默认分隔符为逗号
read_table:从文件、url、文件型对象中加载带分隔符的数据,默认分割符号为制表符‘\t’
read_fwf:读取固定款列格式的数据
read_clipboard:读取剪切板中的数据,可以看做是read_table的剪切板,可以用在将网页中的数据转换为表格中数据时用到

pd.read_csv('data.csv')#默认会把第一行作为头部
out:
a   b   c   d   e
0   1   2   3   4   5
1   6   7   8   9   10


pd.read_table('data.csv',sep=',')#默认会把第一行作为头部
out:
a   b   c   d   e
0   1   2   3   4   5
1   6   7   8   9   10


pd.read_csv('data.csv',header=None)#没有头部,所有文件里的数据都是目标数据,它会自动给你生成头
out:
0   1   2   3   4
0   a   b   c   d   e
1   1   2   3   4   5
2   6   7   8   9   10

#指定索引
pd.read_csv('data.csv',index_col='c')#指定c列为索引列
out:
a   b   d   e
c               
3   1   2   4   5
8   6   7   9   10

a = pd.read_csv('data.csv',index_col=['c','d'])#指定c,d列为索引列
a
out:
    a   b   e
c   d           
3   4   1   2   5
8   9   6   7   10

pd.read_csv('data1.csv')#文件中的NaN代表的就是空
out:
a   b   c   d   message data
0   1   2   3   4   5   NaN
1   hello   6   7   8   9   world
2   NaN hi  10  11  12  14

pd.read_csv('data1.csv',skiprows=[1])#不读取哪一行,这里表示不读第一行
out:
a   b   c   d   message data
0   hello   6   7   8   9   world
1   NaN hi  10  11  12  14

#找出空的
data = pd.read_csv('data1.csv')
data.isnull()
out:
a   b   c   d   message data
0   False   False   False   False   False   True
1   False   False   False   False   False   False
2   True    False   False   False   False   False
#指定读取,一般是指大文件
pd.read_csv('data1.csv',nrows=5) #指定读取五行
out:
a   b   c   d   message data
0   1   2   3   4   5   NaN
1   hello   6   7   8   9   world
2   NaN hi  10  11  12  14

data =pd.read_csv('data1.csv',nrows=5) #指定读取五行
data.to_csv('data2.csv',sep='|')
out:
image.png

读取excel

excel = pd.read_excel('data_excel.xlsx')
p1 = excel.plot(kind='scatter',x='age',y='place').get_figure()
# p1.savefig('1.png') 把画图的图保存为图片
上一篇下一篇

猜你喜欢

热点阅读