创建保存csv

2018-10-19  本文已影响0人  IthinkIcanfly

import csv
#导入类库
csvFile = open("../files/test.csv", 'w+')
#创建或打开一个文件
try:
    writer = csv.writer(csvFile)
    #拿到写入文件
    writer.writerow(('number', 'number plus 2', 'number times 2'))
    #写入
    for i in range(10):
        writer.writerow( (i, i+2, i*2))
finally:
    #关闭文件
    csvFile.close()

采集维基百科写入csv

import csv
from urllib.request import urlopen
from bs4 import BeautifulSoup

html = urlopen("http://en.wikipedia.org/wiki/Comparison_of_text_editors")
bsObj = BeautifulSoup(html)
# 主对比表格是当前页面上的第一个表格
table = bsObj.findAll("table",{"class":"wikitable"})[0]
rows = table.findAll("tr")
csvFile = open("../files/editors.csv", 'wt', newline='', encoding='utf-8')
writer = csv.writer(csvFile)
try:
    for row in rows:
        csvRow = []
        for cell in row.findAll(['td', 'th']):
            csvRow.append(cell.get_text())
        writer.writerow(csvRow)
finally:
    csvFile.close()

如果你有很多 HTML 表格,且每个都要转换成 CSV 文件,或者许多 HTML 表格都要汇总到一个 CSV 文件,那么把这个程序整合到爬虫里以解决问题非常好。但是,如果你只需要做一次这种事情,那么更好的办法就是:复制粘贴。选择 HTML 表格内容然后粘贴到 Excel 文件里,可以另存为 CSV 格式,不需要写代码就能搞定!

上一篇下一篇

猜你喜欢

热点阅读