Python openpyxl模块学习之轻松玩转Excel
前言
当你需要每天对 excel 做大量重复的操作,如果只靠人工来做既浪费时间,又十分枯燥,好在 python 为我们提供了许多操作 excel 的模块,能够让我们从繁琐的工作中腾出双手。
今天就和大家分享一个快速处理 excel 的模块 openpyxl,它的功能相对与其他模块更为齐全,足够应对日常出现的问题。
openpyxl 安装
直接在命令提示符中输入。
pip install openpyxl
或使用豆瓣镜像安装。
pip install -i https://pypi.douban.com/simple openpyxl
安装成功后,下面就看看如何使用
打开/创建工作簿
示例工作簿
工作表【一等奖】
工作表【二等奖】
(1)打开本地工作簿
>>> from openpyxl import load_workbook >>> wb = load_workbook('获奖名单.xlsx')
(2)创建空的工作薄
>>> from openpyxl import workbook >>> wb1 = workbook()
访问工作表
创建新工作表,可指定插入的位置(0:首位,-1:末尾)。
>>> wb.create_sheet('new_sheet', 0) <worksheet "new_sheet">
获取工作簿中所有工作表。
>>> wb.sheetnames ['new_sheet', '一等奖', '二等奖']
使用列表推导式遍历获取所有工作表名称。
>>> [sheet.title for sheet in wb] ['new_sheet', '一等奖', '二等奖']
使用 wb[sheetname] 来获取一个工作表对象
>>> wb['二等奖'] <worksheet "二等奖">
获取活动表(即打开工作簿首先出现的工作表)。
>>> wb.active <worksheet "一等奖">
获取工作表行列信息。
>>> sheet1 = wb['一等奖'] >>> sheet1.max_column 7 >>> sheet1.max_row 6
获取单元格信息
访问某个单元格
>>> sheet1['d3'] <cell '一等奖'.d3> >>> sheet1.cell(row=3, column=4) <cell '一等奖'.d3>
如果访问单元格式添加 value 参数则会修改当前单元格的值。
>>> sheet1.cell(3, 4).value '基于spark、python的医护人员信息抽取与管理' >>> sheet1.cell(3, 4, value='python') <cell '一等奖'.d3> >>> sheet1.cell(3, 4).value 'python'
获取单元格的值、坐标、行索引、列索引。
>>> sheet1['d3'].value 'python' >>> sheet1['d3'].coordinate 'd3' >>> sheet1['d3'].row 3 >>> sheet1['d3'].column 4
访问多个单元格
使用切片来访问多个单元格,这里的切片与列表切片有区别,列表切片是前闭后开,excel 中的切片是前闭后闭。
(1)选取 a1:b2 区域的单元格。
>>> sheet1['a1':'b2'] ((<cell '一等奖'.a1>, <cell '一等奖'.b1>), (<cell '一等奖'.a2>, <cell '一等奖'.b2>))
选取单列数据。
>>> sheet1['d'] (<cell '一等奖'.d1>, ... <cell '一等奖'.d6>)
选取b,c列数据。
>>> sheet1['b:c'] ((<cell '一等奖'.b1>, ... <cell '一等奖'.b6>), (<cell '一等奖'.c1>, ... <cell '一等奖'.c6>))
选取单行数据。
>>> sheet1[3] (<cell '一等奖'.a3>, <cell '一等奖'.b3>, ... <cell '一等奖'.f3>, <cell '一等奖'.g3>)
选取第2,3行数据。
>>> sheet1[2:3] ((<cell '一等奖'.a2>, ... <cell '一等奖'.g2>), (<cell '一等奖'.a3>, ... <cell '一等奖'.g3>))
遍历获取数据
按行遍历指定范围(b2:c3)数据。
>>> for row in sheet1.iter_rows(min_row=2, max_row=3, min_col=2, max_col=3): for cell in row: print(cell.coordinate) b2 c2 b3 c3
按列遍历指定范围(b2:c3)数据。
>>> for col in sheet1.iter_cols(min_row=2, max_row=3, min_col=2, max_col=3): for cell in col: print(cell.coordinate) b2 b3 c2 c3
如果 iter_rows()/iter_cols() 中指定参数 values_only=true,那么将只返回单元格的值
按行遍历所有数据。
>>> tuple(sheet1.rows) ((<cell '一等奖'.a1>, ... <cell '一等奖'.g1>), ... ... (<cell '一等奖'.a6>, ... <cell '一等奖'.g6>))
按列遍历所有数据。
>>> tuple(sheet1.columns) ((<cell '一等奖'.a1>, ... <cell '一等奖'.a6>), ... ... (<cell '一等奖'.g1>, ... <cell '一等奖'.g6>))
修改工作表
单元格赋值
新增一列计算 作者 人数。
>>> for row_index in range(2, sheet1.max_row + 1): sheet1.cell(row_index, 8).value = len(sheet1.cell(row_index, 6).value.split(','))
使用公式给单元格赋值,h7 统计作者总人数。
>>> sheet1['h7'] = '=sum(h1:h6)'
追加一行数据
使用列表按序传入值。
>>> sheet1.append([str(n) for n in range(6)])
使用字典指定 列索引:列值 。
>>> sheet1.append({'a':'1','c':'3'})
插入空白行
在指定位置插入空白行, idx 行索引,插入的位置;amount 插入空白行的数量
>>> sheet1.insert_rows(idx=2, amount=2)
删除工作表
>>> wb.remove(wb['new_sheet'])
保存工作簿
>>> wb.save('获奖名单v1.xlsx')
修改样式
字体
设置 b2 单元格字体格式为,颜色可以用十六进制颜色代码。
>>> from openpyxl.styles import font >>> new_font = font(name='微软雅黑', size=20, color='3333cc', bold=true) >>> sheet1['b2'].font = new_font
单元格背景颜色
>>> from openpyxl.styles import patternfill, colors >>> sheet1["a2"].fill = patternfill("solid", fgcolor=colors.blue) >>> sheet1["a3"].fill = patternfill("solid", fgcolor='ff66cc')
对齐方式
设置 d2 中的数据 垂直居中 和 水平居中 。
>>> from openpyxl.styles import alignment >>> sheet1['d2'].alignment = alignment(horizontal='center', vertical='center')
行高/列宽
设置第2行行高为40,c列列宽为20。
>>> sheet1.row_dimensions[2].height = 40 >>> sheet1.column_dimensions['c'].width = 20
合并/拆分单元格
合并单元格只需要指定左上角和右下角的单元格坐标。
>>> sheet.merge_cells('a1:c3')
拆分单元格后,合并区域的值会赋给左上角单元格a1。
>>> sheet.unmerge_cells('a1:c3')
以上就是python openpyxl模块学习之轻松玩转excel的详细内容,更多关于python openpyxl模块的资料请关注其它相关文章!