使用 openpyxl 处理 Excel 表格

2018-02-21  本文已影响0人  Manchangdx

1、安装 openpyxl:

zds@ubuntu ~ $ sudo pip3 install openpyxl
The directory '/home/zds/.cache/pip/http' or its parent directory ...
The directory '/home/zds/.cache/pip' or its parent directory ...
Collecting openpyxl
  Downloading openpyxl-2.5.0.tar.gz (169kB)
    100% |████████████████████████████████| 174kB 28kB/s 
Collecting jdcal (from openpyxl)
  Downloading jdcal-1.3.tar.gz
Collecting et_xmlfile (from openpyxl)
  Downloading et_xmlfile-1.0.1.tar.gz
Installing collected packages: jdcal, et-xmlfile, openpyxl
  Running setup.py install for jdcal ... done
  Running setup.py install for et-xmlfile ... done
  Running setup.py install for openpyxl ... done
Successfully installed et-xmlfile-1.0.1 jdcal-1.3 openpyxl-2.5.0
zds@ubuntu ~ $ 

2、在 shell 里使用 openpyxl 的 Workbook 方法创建一个工作簿,即一个 .xlsx 文件:

zds@ubuntu ~ $ ipython
Python 3.5.2 (default, Nov 23 2017, 16:37:01) 
Type 'copyright', 'credits' or 'license' for more information
IPython 6.2.1 -- An enhanced Interactive Python. Type '?' for help.

In [1]: from openpyxl import Workbook

In [2]: wb = Workbook()   # wb 就是一个工作簿

# 创建工作簿时自动生成一张工作表并运行此工作表
In [3]: wb.active         # 当前运行的工作表
Out[3]: <Worksheet "Sheet">

In [4]: ws = wb.active

In [5]: ws
Out[5]: <Worksheet "Sheet">

3、使用 create_sheet 方法创建工作表:

In [6]: ws1 = wb.create_sheet()    # 默认新建工作表插入到工作簿末尾

# 设置新建工作表插入到工作簿第一个位置,表名为 Kitty
In [7]: ws2 = wb.create_sheet(index=0, title='Kitty')   

# 在创建工作表的时候系统自动命名(Sheet,Sheet1,Sheet2 ...)
# 用 title 方法可以修改工作表的名字
In [8]: ws2.title = 'Kobe'

In [9]: ws2 is wb['Kobe']          # 通过工作簿的 key 可以获得工作表
Out[9]: True

In [10]: wb.sheetnames             # 打印所有工作表的名字
Out[10]: ['Kobe', 'Sheet', 'Sheet1']

In [11]: ws2 is wb[wb.sheetnames[2]]
Out[11]: True

4、操作数据

# 新建的工作表里是没有单元格的
In [42]: ws['A1']                    # 这一步就创建了一个新的单元格到内存
Out[42]: <Cell 'Sheet'.A1>

In [43]: ws.cell(row=1, column=1)    # 同上
Out[43]: <Cell 'Sheet'.A1>

In [44]: c = ws['A1']

In [45]: ws['A1'] = 'hello'          # 向单元格里填入数据,赋值即修改

In [46]: c.value                     # 获得单元格数据
Out[46]: 'hello'

# 注意:当一个工作表被创建时,其中不包含单元格,只有当单元格被获取时才被创建
# 这种方式我们不会创建我们从不会使用的单元格,从而减少了内存消耗
In [47]: for i in range(1, 6):       # 这步操作会在内存中生成 20 个单元格
    ...:     for j in range(1, 5):   # 不管对它们赋值与否都生成了,占了内存
    ...:         ws.cell(row=i, column=j)
    ...:         

In [48]: ws['A1': 'C3']              # 使用切片获取多个单元格,若没有则自动创建
Out[48]: 
((<Cell 'Sheet'.A1>, <Cell 'Sheet'.B1>, <Cell 'Sheet'.C1>),
 (<Cell 'Sheet'.A2>, <Cell 'Sheet'.B2>, <Cell 'Sheet'.C2>),
 (<Cell 'Sheet'.A3>, <Cell 'Sheet'.B3>, <Cell 'Sheet'.C3>))

In [40]: ws.rows                     # 迭代器,可获取全部单元格
Out[49]: <generator object Worksheet._cells_by_row at 0x7fc20b791f68>

In [50]: ws.columns                  # 同上
Out[50]: <generator object Worksheet._cells_by_col at 0x7fc20b8a4ba0>

In [17]: for i in ws.rows:           # 打印全部单元格
    ...:     print(i)
    ...:     
(<Cell 'Sheet'.A1>, <Cell 'Sheet'.B1>, <Cell 'Sheet'.C1>, <Cell 'Sheet'.D1>)
(<Cell 'Sheet'.A2>, <Cell 'Sheet'.B2>, <Cell 'Sheet'.C2>, <Cell 'Sheet'.D2>)
(<Cell 'Sheet'.A3>, <Cell 'Sheet'.B3>, <Cell 'Sheet'.C3>, <Cell 'Sheet'.D3>)
(<Cell 'Sheet'.A4>, <Cell 'Sheet'.B4>, <Cell 'Sheet'.C4>, <Cell 'Sheet'.D4>)
(<Cell 'Sheet'.A5>, <Cell 'Sheet'.B5>, <Cell 'Sheet'.C5>, <Cell 'Sheet'.D5>)

In [18]: l = list('abcd')

In [19]: ws.append(l)         # 此方法可以添加一行数据,注意参数为列表或元组

In [20]: for i in ws.values:  # 此属性可获得全部单元格的值,格式为列表,列表元素为元组
   ...:     print(i)
   ...:     
('hello', None, None, None)
(None, None, None, None)
(None, None, None, None)
(None, None, None, None)
(None, None, None, None)
('a', 'b', 'c', 'd')

5、保存文件

# 将工作簿保存到本地,参数为文件名
In [19]: wb.save('test.xlsx')

6、从文件中导入数据

In [29]: from openpyxl import load_workbook

In [30]: wbl = load_workbook('test.xlsx')

In [31]: wbl.sheetnames
Out[31]: ['Sheet', 'Sheet1', 'Kobe']
上一篇 下一篇

猜你喜欢

热点阅读