【Python爬虫】每次追加到新的sheet中

2024-07-18  本文已影响0人  小仙女本人呀

在Pandas中,如果你想要在写入Excel文件后继续追加更多的DataFrame数据,可以使用ExcelWriter对象的mode='a'(追加模式)选项。这允许你打开现有的Excel文件,并在不覆盖现有数据的情况下写入新的数据。

  1. 使用ExcelWriter的追加模式(mode='a')来写入数据。
with pd.ExcelWriter('文章列表.xlsx', engine='openpyxl', mode='a') as writer:
        parse_and_save_data(base_url, headers, context, writer)
  1. 使用writer.sheets.keys().len()动态生成sheet名称。
# 将DataFrame写入Excel,每次追加到新的sheet中
        df.to_excel(writer, sheet_name=f'Sheet{writer.sheets.keys().__len__()}', index=False)
        print(f'数据已保存到Excel文件的 "Sheet{writer.sheets.keys().__len__() - 1}"')

以下是如何使用ExcelWriter以追加模式写入Excel文件的示例:

import pandas as pd

# 假设df1和df2是你要写入的两个DataFrame
df1 = pd.DataFrame({'A': [1, 2], 'B': [3, 4]})
df2 = pd.DataFrame({'A': [5, 6], 'B': [7, 8]})

# 写入第一个DataFrame到Excel
with pd.ExcelWriter('data.xlsx', engine='openpyxl', mode='w') as writer:
    df1.to_excel(writer, index=False)

# 追加第二个DataFrame到Excel的新的sheet
with pd.ExcelWriter('data.xlsx', engine='openpyxl', mode='a') as writer:
    df2.to_excel(writer, sheet_name='Sheet2', index=False)

在这个例子中:

请注意以下几点:

使用追加模式是一种节省内存的有效方法,特别是当你需要分批次处理和写入大量数据时。

上一篇 下一篇

猜你喜欢

热点阅读