Python读取CSV文件,字段内有换行符,逗号的情况
2019-05-25 本文已影响0人
21b162136419
CSV文件
csv为使用逗号进行分割的文件,但当字段中有逗号(",")、换行符("\n")时,需要用双引号(”)将该字段包起来。若字段中有双引号时,则需要在字段里的双引号前额外添加一个双引号表转义。如:

遇到的问题
首先以下是逐行读取csv的代码。由于csv文件包含了emoji表情,而emoji表情使用的是Unicode编码,因此在打开csv文件时,需要加上**encoding='mac_roman' **使用非utf-8的编码方式读取。
···
with open('./data/train.csv', 'r', encoding='mac_roman') as f:
reader = csv.reader(f)
lines = []
for line in reader:
lines.append(line)
···
读完后,发现lines里面是一行一行读取的,并不是按照csv的一行进行读取