运营的Python指南 - Python 操作Excel
这是一份写给运营人员的python指南。本文主要讲述如何使用python操作excel。完成excel的创建,查询和修改操作。
相关代码请参考 https://github.com/rustfisher/python-playground
本文链接:https://www.rustfisher.com/2019/11/05/python/python-op-excel_openpyxl_use/
开发工具,环境
- pycharm - 方便好用的ide
- python3
这里默认你的电脑上已经装有python3.x,环境变量已经配置好。
引入openpyxl
这里使用库来操作excel。类似的库还有xlrd。
penpyxl的基础使用方法请参见python openpyxl 处理excel使用指南。
pip install openpyxl
数据准备
假定数据来自百度指数,以常见的一些搜索指数为例。给后面的操作准备一些数据,把数据写入excel中。
创建workbook对象,获取到当前可用的表格(sheet)。
直接使用append
方法把一行数据追加写入。最后调用workbook的保存方法,存储数据。
def create_excel_demo(file_path): """ 创建excel文件,并写入数据 :param file_path: 目标文件路径 :return none """ wb = workbook() ws = wb.active ws.title = '搜索指数概览' ws.append(['关键词', '整体日均值', '移动日均值', '整体同比', '整体环比', '移动同比', '移动环比']) ws.append(['excel', 27782, 18181, -0.11, -2, 0.21, 0.02]) ws.append(['python', 24267, 8204, 0.27, 0.06, 0.56, 0.01]) ws.append(['文案', 2411, 1690, 0.56, 0.33, 0.91, 0.46]) ws.append(['okr', 1928, 880, 0.38, 0.15, 0.29, 0.09]) ws.append(['kpi', 4212, 2784, 0.21, -0.19, 0.36, -0.22]) wb.save(file_path)
创建出来的表格,示例数据如下
关键词 | 整体日均值 | 移动日均值 | 整体同比 | 整体环比 | 移动同比 | 移动环比 |
---|---|---|---|---|---|---|
excel | 27782 | 18181 | -0.11 | -2 | 0.21 | 0.02 |
python | 24267 | 8204 | 0.27 | 0.06 | 0.56 | 0.01 |
... |
读取数据
访问整个表格的数据
访问表格中所有的数据,并打印出来。
首先我们要知道表格中有数据的单元格的范围,使用sheet.max_row与sheet.max_column获取表格的行列数量。
def read_xlsx_basic(file_path): """ 读取excel的数据并打印出来 """ wb = load_workbook(file_path) st = wb.active end_row = st.max_row + 1 end_column = st.max_column + 1 print(st.title, '有', end_row, '行', end_column, '列') for row in range(1, end_row): for col in range(1, end_column): print('{:10}'.format(st.cell(row=row, column=col).value), end='') print()
值得注意的是,单元格下标是从1开始的。如果使用了不当的下标,报错信息
valueerror: row or column values must be at least 1
参考:
修改表格
有了excel表格后,我们可以修改表格的一些格式和数据。
st
表示当前表。
调整列的宽度
用 column_dimensions 来获取列。例如column_dimensions['a']获取到的是第a列。ord
方法是将字符转换为ascii码。ord('a')得到65。
这里调整的是a列到g列的宽度。
for col in range(ord('a'), ord('g') + 1): st.column_dimensions[chr(col)].width = 15
设置单元格格式
格式,比如字体大小,对齐模式,粗体斜体等。
字体
首先我们要拿到单元格cell,这里使用st.cell(row=1, column=col)来获取某一个格子。
cell持有的font是不可修改的。不能使用如cell.font.size = 13
这样的操作,会报异常。
copy方法是复制一个对象。这里复制的是font。
cell = st.cell(row=1, column=col) font = copy(cell.font) font.size = 13 font.bold = true cell.font = font
对齐
对齐模式。使用alignment属性。
cell.alignment = alignment(horizontal="center", vertical="center")
数据显示
操作excel时,我们可以设置单元格数据显示的方式,比如常规,数值,货币,百分比等等。
这里使用的是number_format属性。
如果数据(value)是0.02,经过下面的设置后,excel中显示的是2%。
cell.number_format = '0%'
修改数据
修改单元格的数值(value)。
修改数据首先要拿到那个单元格cell,然后对其value赋值。
st.cell(row=2, column=7).value = 0.42 # 修改数值
修改了单元格的样式和数据后,可以打开表格看看效果。