Python全栈工程师

22.2-csv模块使用

2019-10-12  本文已影响0人  BeautifulSoulpy

所有微笑的背后,是无声的泪水,所有表面的坚强,都是死撑硬扛,成人的世界里,笑是哭的替代,强是弱的伪装。

如果一个人影响到了你的情绪,你的焦点应该放在把控自己的情绪上,而不是影响你情绪的人身上。只有这样,才能真正的自信起来!


CSV模块

csv是逗号分隔值(Comma-Separated Values)的简称!
CSV 是一个被行分隔符、列分隔符划分成 行和列的文本文件;
CSV不指定字符编码;
行分隔符为\r\n ,最后一行可以没有换行符;
列分割符常作为 符号 或者 制表符;

1.CSV的优点

看了定义我们知道CSV有如下优点:

  1. 适合存放结构化信息,较为通用(CSV通用标准并不存在)
  2. 数据体积更小,创建分方便(本身是文本格式对比Excel这一类数据本身带有格式)
  3. Windows环境下CSV默认打开方式是Excel。

2.CSV库的使用

csv库有四个主要的类 writer,DictWriter,reader,DictReader
reader和 DictReader都接受一个可以逐行迭代的对象作为参数,一般是一个包含 csv格式数据的文件对象。

writer和 DictWriter则接受一个 csv文件对象,csv格式的数据将会写入到这个文件中。
他们都会返回一个对应的对象,我们通过这个对象来进行数据的读和写。
这四者中 reader和 writer对应,DictReader和 DictWriter对应,也就是说通过 writer类写的 csv文件只能通过 reader类来读取,DictReader同理。

# 创建目录;
p = Path('./a/b/b.csv') 
#p.parent.mkdir(parents=True)   # 文件夹 已经存在的时候无法重复创建;
p.parent.mkdir(parents=True,exist_ok=True)   # exist_ok = True 防止文件夹已经存在;

with p.open('w') as f:
    f.write('1,tom,18,beijing\r\n')
    f.write('2,jerry,20,xi an"shaanxi')

with open(str(p)) as f:  # f为可迭代对象;
    reader = csv.reader(f)
    print(next(reader))
    print(next(reader))
    print(next(reader))
#--------------------------------------------------------
['1', 'tom', '18', 'beijing']
[]
['2', 'jerry', '20', 'xi an"shaanxi']

#迭代器最终会报错,所以换成 for循环;
with open(str(p)) as f:  # f为可迭代对象;
    reader = csv.reader(f)
    for line in reader:
        print(line)
#--------------------------------------------------------
['1', 'tom', '18', 'beijing']
[]
['2', 'jerry', '20', 'xi an"shaanxi']


with open(str(p),'w',newline='') as f:  # f为可迭代对象;
    writer = csv.writer(f)
    writer.writerow(rows[0])  # 单行的写入;
    writer.writerow(rows)   # 多行一起的写入;
#----------------------------------------

总结一下使用 csv库的注意事项:

  1. 打开文件时要 注意模式 读用 r,写用 w
  2. 打开文件时要设置 newline=''(空字符).
    win下会在每行末尾多出一个\r,解决办法是加上一个 newline=' '参数; with open(str(p),'w',newline='') as f:
  3. 打开文件时要指定编码打开,写入时也一样
  4. 如果设置过分隔符就要一直保持,读写时的分隔符必须一致
  5. csv不会检查格式(虽然有个 strict模式,但 strict模式下也不会对格式进行检查),写入文件时一定要注意格式

3.csv将数据写入文件

import csv

#通过 writer类写入数据
#待写入的数据 注意到两个列表的元素个数不一样
test_writer_data_1 = ['Tom', 'Cody', 'Zack']
test_writer_data_2 = ['Mike', 'Bill']

#创建并打开文件
with open('test_writer.csv', 'w', newline='', encoding='utf-8') as csvfile:
  #获得 writer对象 delimiter是分隔符 默认为 ","
  writer = csv.writer(csvfile, delimiter=' ')
  #调用 writer的 writerow方法将 test_writer_data写入 test_writer.csv文件
  writer.writerow(test_writer_data_1)
  writer.writerow(test_writer_data_2)


#通过 DictWriter类写入数据
#待写入的数据 注意到待写入的数据类型为 dict 且第二个字典没有 lastname
test_dict_writer_data_1 = {'firstname': 'Tom', 'lastname': 'Loya'}
test_dict_writer_data_2 = {'firstname': 'Tom', 'lastname': 'Loya'}

#创建并打开文件
with open('test_dict_writer.csv', 'w', newline='', encoding='utf-8') as csvfile:
  #设置表头
  fieldnames=['firstname', 'lastname']
  # 获得 DictWriter对象 delimiter是分隔符 默认为 "," 表头为 'firstname' 'lastname'
  dict_writer = csv.DictWriter(csvfile, delimiter=' ', fieldnames=fieldnames)
  #第一次写入数据先写入表头
  dict_writer.writeheader()
  #调用 DictWriter的 writerow方法将 test_dict_writer_data写入 test_dict_writer.csv文件
  dict_writer.writerow(test_dict_writer_data_1)
  dict_writer.writerow(test_dict_writer_data_2)

通过上面的例子我们可以发现,csv对写入的数据不做任何检查,也就是说几乎没有任何标准可言。

我们发现 writerow方法不会对数据进行检查,即使前后两句 writerow语句写入的数据的格式不同也不会报错。

所以在用 csv写入数据时要特别注意数据的格式问题!!!
也可以用 writerows(list) 一次写入多行

4.csv从文件读取数据

返回reader对象,是一个行迭代器;
默认使用excel方言,如下:

delimiter 列分解符号,
lineterminater 行分隔符\r\n
quotechar 字段的引用符号,缺省为"双引号;
双引号的处理

import csv

#通过 reader读取文件内容 注意到之前我们设置了 delimiter为空格,这里也要继续设置为空格
with open('test_writer.csv', 'r', newline='', encoding='utf-8') as csvfile:
  reader = csv.reader(csvfile, delimiter=' ')
  for row in reader:
      print(row)

with open('test_dict_writer.csv', 'r', newline='', encoding='utf-8') as csvfile:
  dict_reader = csv.DictReader(csvfile, delimiter=' ')
  for row in dict_reader:
      print(row)

上一篇下一篇

猜你喜欢

热点阅读