《python编程自动上手》笔记8 处理PDF 和 Word 文

2019-01-13  本文已影响0人  原来是酱紫呀

20190113 qzd


pdf 和 word 是二进制文件,所以它们比纯文本文件要复杂的多。除了文本,它们还保存了许多字体、颜色和布局信息。

1. pdf 文档

从pdf读取文本内容 和 从已有的文档生成新的pdf:PyPDF2 模块

2. word 文档

python-docx 模块

上一篇 下一篇

猜你喜欢

热点阅读