在python中使用csv
在python中使用csv
这篇文章讨论的如何使用python加载和解析csv文件
- 首先,什么是csv呢?
CSV(逗号分隔值)是一种用于存储表格数据(如电子表格或数据库)的简单文件格式。CSV文件以纯文本形式存储表格数据(数字和文本)。文件的每一行都是一个数据记录。每个记录由一个或多个字段组成,字段之间用逗号分隔。逗号作为字段分隔符的使用是该文件格式名称的来源。
由于csv是python的内建模块,所以我们不需要安装它
1、 读取csv文件
#首先,导入csv模块
import csv
#被读取的csv文件名
filename = 'example.csv'
#初始化字段和行列表
fields = []
rows = []
#打开并读取
with open(filename,'r') as csvfile:
#创建一个csv reader对象
csvreader = csv.reader(csvfile)
#通过第一行,提取csv文件的字段
#在python3中,需要使用next(csvreader),但是在Python2中,使用csvreader.next()
#fields = csvreader.next()
fields = next(csvreader)
#逐行读取数据
for row in csvreader:
rows.append(row)
#获取总行数
print('Total no. of rows: %d' % (csvreader.line_num))
#打印字段名称
print('field names are:' + ','.join(field for field in fields))
#打印前五行
print('\nFist 5 rows are:\n')
for row in rows[:5]:
#解析行的每一列
for col in row:
print('%10s' % col)
print('\n')
我们来分析一下上面的代码
with open(filename, 'r') as csvfile:
csvreader = csv.reader(csvfile)
在这里,我们首先以读取模式打开CSV文件。文件对象被命名为csvfile。文件对象被转换为csv。我们保存csv为csvreader。
fields = csvreader.next()
csvreader是一个可迭代的对象。因此,.next()方法返回当前行并将迭代器推进到下一行。因为csv文件的第一行包含标题(或字段名),所以我们将它们保存在一个名为fields的列表中。
for row in csvreader:
rows.append(row)
现在,我们使用for循环遍历剩余的行。每一行都被添加到一个名为rows的列表中。如果尝试打印每一行,您会发现该行只是一个包含所有字段值的列表。
print("Total no. of rows: %d"%(csvreader.line_num))
csvreader.line_num只是一个计数器,它返回已迭代的行数。
1、写入csv
import csv
#字段名称
fields = ['Name','Branch','Year','CGPA']
#行数据
rows = [ ['Nikhil', 'COE', '2', '9.0'],
['Sanchit', 'COE', '2', '9.1'],
['Aditya', 'IT', '2', '9.3'],
['Sagar', 'SE', '1', '9.5'],
['Prateek', 'MCE', '3', '7.8'],
['Sahil', 'EP', '2', '9.1']]
#csv文件的名字
filename = 'university_records.csv'
#写入csvw文件
with open(filename,'w') as csvfile:
csvwriter = csv.writer(csvfile)
#写入字段
csvwriter.writerow(fields)
#写入行数据
csvwriter.writerows(rows)
分析代码
字段和行已经定义。字段是包含所有字段名称的列表。行是列表的列表。每一行都是一个包含该行字段值的列表。
with open(filename, 'w') as csvfile:
csvwriter = csv.writer(csvfile)
在这里,我们首先以写模式打开CSV文件。文件对象被命名为csvfile。文件对象被转换为csv。我们保存csv.writer对象作为csvwriter。
csvwriter.writerow(fields)
现在我们使用writerow方法来写入第一行,这一行就是字段名。
csvwriter.writerows(rows)
我们使用writerows方法一次写多行
3、写csv写入一个字典
import csv
# 字典对象的行数据
mydict =[{'branch': 'COE', 'cgpa': '9.0', 'name': 'Nikhil', 'year': '2'},
{'branch': 'COE', 'cgpa': '9.1', 'name': 'Sanchit', 'year': '2'},
{'branch': 'IT', 'cgpa': '9.3', 'name': 'Aditya', 'year': '2'},
{'branch': 'SE', 'cgpa': '9.5', 'name': 'Sagar', 'year': '1'},
{'branch': 'MCE', 'cgpa': '7.8', 'name': 'Prateek', 'year': '3'},
{'branch': 'EP', 'cgpa': '9.1', 'name': 'Sahil', 'year': '2'}]
# 字段名称
fields = ['name', 'branch', 'year', 'cgpa']
# csv文件名称
filename = "university_records.csv"
# 写入csv
with open(filename, 'w') as csvfile:
# 创建一个csv dict writer 对象
writer = csv.DictWriter(csvfile, fieldnames = fields)
#字段的写入
writer.writeheader()
# 行数据的写入
writer.writerows(mydict)
这个例子中,我们将mydict写入csv文件
with open(filename, 'w') as csvfile:
writer = csv.DictWriter(csvfile, fieldnames = fields)
在这里,文件对象(csvfile)被转换为一个DictWriter对象。我们将字段名指定为参数。
writer.writeheader()
writeheader方法仅使用预先指定的字段名写入csv文件的第一行。
writer.writerows(mydict)
writerows方法只写入所有行,但是在每一行中,它只写入值(而不是key)。