欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

如何用 Python 自动化操作 Excel

程序员文章站 2022-03-28 16:12:11
选择 VBA 还是 Python 取决于你的需求。如果你只在 Excel 里做,并且数据量不超过它的限制的话,可以用 VBA 或 Excel 自有的功能。用 Python 处理 Excel 可以试下这几个库,我们整理了常用的功能,给学员做了速查表,也给你看下一、工具包1.xlrd:从Excel电子表格中提取数据 doc地址:https://xlrd.readthedocs.io/en/latest/2.xlwt:将数据写入Excel电子表格 doc地址:https://xlwt.readt...

选择 VBA 还是 Python 取决于你的需求。
如果你只在 Excel 里做,并且数据量不超过它的限制的话,可以用 VBA 或 Excel 自有的功能。
用 Python 处理 Excel 可以试下这几个库,我们整理了常用的功能,给学员做了速查表,也给你看下

如何用 Python 自动化操作 Excel

一、工具包

1.xlrd:从Excel电子表格中提取数据  doc地址:https://xlrd.readthedocs.io/en/latest/
2.xlwt:将数据写入Excel电子表格   doc地址:https://xlwt.readthedocs.org/en/latest/
3.xlutils:提供一组处理Excel文件的实用程序  doc地址:https://xlutils.readthedocs.io/en/latest/

二、安装

python -m pip install xlrd xlwt xlutils

三、基本用法
python操作excel的相关工具包可以具体到操作指定单元格的填充样式、数值类型、数值大小等等。然而python操作excel需要一定pandas数据处理功底,后续将补上章节:pandas数据处理技能

1.从指定文件路径读取excel表格,进行一定操作,然后保存到另一个excel文件:result.xlsx

import xlwt
import xlrd
from xlutils.copy import copy
import pandas as pd
from pandas import DataFrame,Series
import os
os.chdir('./')
# 从指定文件路径读取excel表格
df = pd.read_excel('D:/mypaper/data/data.xlsx')
# 查看df内容
# 根据age算出出生年份,增加一列
import datetime
import os
year = datetime.datetime.now().year#获取当前系统时间对应的年份
df['birth'] = year-df['age']
df.to_excel('result.xlsx')#保存到当前工作目录,可以用os.getcwd()查看
#查看下此时df的内容,可以看到已经生成了birth这一列

乍看好像只用到了pandas,还没有用到上面介绍的三个工具包,下面介绍利用python操作excel底层

2.单元格操作

# 定义方法:读取指定目录下Excel文件某个sheet单元格的值
def excel_read(file_path,table,x,y):
     data = xlrd.open_workbook(file_path)
     table = data.sheet_by_name(table)
     return table.cell(y,x).value

# 定义方法:单元格值及样式
write_obj_list = []
def concat_obj(cols,rows,value):
    write_obj_list.append({'cols':cols,'rows':rows,'value':value,\
'style':xlwt.easyxf('font: name 宋体,height 280;alignment: horiz centre')})

# 定义方法:合并单元格
def merge_unit(srows,erows,scols,ecols,value):
    write_obj_list.append({'id':'merge','srows':srows,'erows':erows,'scols':scols,\
'ecols':ecols,'value':value,'style':xlwt.easyxf('font: name 宋体,height 280;alignment: horiz centre')})

# 定义方法:更新excel
excel_update(file_path,write_obj_list,new_path):
    old_excel = xlrd.open_workbook(file_path, formatting_info=True)
    #管道作用
    new_excel = copy(old_excel)
    '''
    通过get_sheet()获取的sheet有write()方法
    '''
    sheet1 = new_excel.get_sheet(0)
    '''
    1代表是修改第几个工作表里,从0开始算是第一个。此处修改第一个工作表
    '''
    for item in write_obj_list:
        if 'id' not in item.keys():
            if 'style' in item.keys():
                sheet1.write(item['rows'], item['cols'], item['value'],item['style'])
            else:
                sheet1.write(item['rows'], item['cols'], item['value'])
        else:
            if 'style' in item.keys():
                sheet1.write_merge(item['srows'],item['erows'],item['scols'], item['ecols'], item['value'],item['style'])
            else:
                sheet1.write_merge(item['srows'],item['erows'],item['scols'], item['ecols'], item['value'])
    '''
    如果报错 dict_items has no attributes sort
    把syle源码中--alist.sort() 修改为----> sorted(alist) 
    一共修改2次
    '''
    new_excel.save(file_path)

#参数详解
# srows:合并的起始行数
# erows:合并的结束行数
# scols:合并的起始列数
# ecols:合并的结束列数 
# value:合并单元格后的填充值
# style:合并后填充风格:
#     font: name 宋体
#     height 280;
#     alignment: horiz centre
#     ... 与excel操作基本保持一致

注意:该方法仅仅是将需要直行的动作保存到一个list中,真正的动作还未执行,执行动作是发生在excel_update方法中

最终调用excel_update方法,传入每个单元格需要进行的操作和填充值的write_obj_list以及文件保存路径file_path

就可以在当前工作目录下生成想要的Excel结果文件。

注意:
1.write_obj_list支持用户自定义
2.write_obj_list也可以是根据excel_read方法读取现有待修改的excel文件(可以维持原有表格的格式)而生成

python操作excel还有很多其他的基本方法,因篇幅的限制不再陈述和演示,想要深入研究的可以点击上面的doc地址。

学会python操作excel的单元格、并掌握上面的方法就可以基本实现excel的自动化报表操作了。

四、Python操作excel优势
4.1 python本身语法简单,作为一门脚本语言可以很方便的进行操作
4.2 python的excel模块强大,直接生成excel图和内容插入
4.3 若要做好几百张类似的图,不用再跟傻瓜一样去拉图啦!!!
4.4 可重复使用

本文地址:https://blog.csdn.net/zhou_xijian/article/details/109638140

相关标签: 分享 python