Python数据处理从零开始----第二章(pandas)⑨pa
2019-01-07 本文已影响286人
柳叶刀与小鼠标
目录
第二章(pandas)
Python数据处理从零开始----第二章(pandas)①删除列
Python数据处理从零开始----第二章(pandas)②处理缺失数据
Python数据处理从零开始----第二章(pandas)③数据标准化(1)
Python数据处理从零开始----第二章(pandas)④数据合并和处理重复值
Python数据处理从零开始----第二章(pandas)⑤pandas与R
Python数据处理从零开始----第二章(pandas)⑥相关性分析
Python数据处理从零开始----第二章(pandas)⑦pandas读写csv文件(1)
Python数据处理从零开始----第二章(pandas)⑧pandas读写csv文件(2)
Python数据处理从零开始----第二章(pandas)⑧pandas读写csv文件(3)
Python数据处理从零开始----第二章(pandas)⑨pandas读写csv文件(4)
===============================================
- 如何在pandas中写入csv文件
我们将首先创建一个数据框。我们将使用字典创建数据框架。键是列名,值是包含数据的列表:
df = pd.DataFrame({'Names':['Andreas', 'George', 'Steve',
'Sarah', 'Joanna', 'Hanna'],
'Age':[21, 22, 20, 19, 18, 23]})
df.head()
![](https://img.haomeiwen.com/i9218360/f1b0e8c843bc4866.png)
然后我们使用pandas to_csv方法将数据框写入csv文件。
df.to_csv('NamesAndAges.csv')
![](https://img.haomeiwen.com/i9218360/a1b6934f97eae6eb.png)
如上图所示,当我们不使用任何参数时,我们会得到一个新列。此列是pandas数据框中的index。我们可以使用参数index并将其设置为false以除去此列。
- 如何将多个数据帧读取到一个csv文件中
如果我们有许多数据帧,并且我们想将它们全部导出到同一个csv文件中。
这是为了创建两个新的列,命名为group和row num。重要的部分是group,它将标识不同的数据帧。在代码示例的最后一行中,我们使用pandas将数据帧写入csv。
df1 = pd.DataFrame({'Names': ['Andreas', 'George', 'Steve',
'Sarah', 'Joanna', 'Hanna'],
'Age':[21, 22, 20, 19, 18, 23]})
df2 = pd.DataFrame({'Names': ['Pete', 'Jordan', 'Gustaf',
'Sophie', 'Sally', 'Simone'],
'Age':[22, 21, 19, 19, 29, 21]})
df3 = pd.DataFrame({'Names': ['Ulrich', 'Donald', 'Jon',
'Jessica', 'Elisabeth', 'Diana'],
'Age':[21, 21, 20, 19, 19, 22]})
df = pd.concat([df1, df2, df3], keys =['Group1', 'Group2', 'Group3'],
names=['Group', 'Row Num']).reset_index()
df.to_csv('MultipleDfs.csv', index=False)
在csv文件中,我们有4列。列表中的keys参数(['group1'、'group2'、'group3'])代表不同数据框来源。我们还得到列“row num”,其中包含每个原数据框的行数:
![](https://img.haomeiwen.com/i9218360/1ccf8f47d1ba18af.png)