互联网科技Python中文社区python自学

Python数据处理从零开始----第二章(pandas)⑨pa

2019-01-07  本文已影响286人  柳叶刀与小鼠标

目录

第二章(pandas)

Python数据处理从零开始----第二章(pandas)①删除列
Python数据处理从零开始----第二章(pandas)②处理缺失数据
Python数据处理从零开始----第二章(pandas)③数据标准化(1)
Python数据处理从零开始----第二章(pandas)④数据合并和处理重复值
Python数据处理从零开始----第二章(pandas)⑤pandas与R
Python数据处理从零开始----第二章(pandas)⑥相关性分析
Python数据处理从零开始----第二章(pandas)⑦pandas读写csv文件(1)
Python数据处理从零开始----第二章(pandas)⑧pandas读写csv文件(2)
Python数据处理从零开始----第二章(pandas)⑧pandas读写csv文件(3)
Python数据处理从零开始----第二章(pandas)⑨pandas读写csv文件(4)

===============================================

df = pd.DataFrame({'Names':['Andreas', 'George', 'Steve',
                           'Sarah', 'Joanna', 'Hanna'],
                  'Age':[21, 22, 20, 19, 18, 23]})
df.head()
image.png

然后我们使用pandas to_csv方法将数据框写入csv文件。

df.to_csv('NamesAndAges.csv')
image.png

如上图所示,当我们不使用任何参数时,我们会得到一个新列。此列是pandas数据框中的index。我们可以使用参数index并将其设置为false以除去此列。

如果我们有许多数据帧,并且我们想将它们全部导出到同一个csv文件中。
这是为了创建两个新的列,命名为group和row num。重要的部分是group,它将标识不同的数据帧。在代码示例的最后一行中,我们使用pandas将数据帧写入csv。

df1 = pd.DataFrame({'Names': ['Andreas', 'George', 'Steve',
                           'Sarah', 'Joanna', 'Hanna'],
                   'Age':[21, 22, 20, 19, 18, 23]})
df2 = pd.DataFrame({'Names': ['Pete', 'Jordan', 'Gustaf',
                           'Sophie', 'Sally', 'Simone'],
                   'Age':[22, 21, 19, 19, 29, 21]})
df3 = pd.DataFrame({'Names': ['Ulrich', 'Donald', 'Jon',
                           'Jessica', 'Elisabeth', 'Diana'],
                   'Age':[21, 21, 20, 19, 19, 22]})


df = pd.concat([df1, df2, df3], keys =['Group1', 'Group2', 'Group3'], 
               names=['Group', 'Row Num']).reset_index()

df.to_csv('MultipleDfs.csv', index=False)

在csv文件中,我们有4列。列表中的keys参数(['group1'、'group2'、'group3'])代表不同数据框来源。我们还得到列“row num”,其中包含每个原数据框的行数:


image.png
上一篇 下一篇

猜你喜欢

热点阅读