欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

学会python操作excel永不加班系列

程序员文章站 2022-03-04 11:29:50
目录一、第三方类库介绍二、安转第三方类库三、引用xlrd读取excel数据四、引入openpyxl写入数据  总结实验环境:系统:win10语言:python3.8承载软件:pycharm2021.1...

 实验环境:

系统:win10

语言:python3.8

承载软件:pycharm2021.1.2 (professional edition)

第三方类库:openpyxl、xlrd

一、第三方类库介绍

xlrd库是一个很常用的读取excel文件的库,其对excel文件的读取可以实现比较精细的控制。

openpyxl是实现excel的写入操作的第三方类库

二、安转第三方类库

pip install xlrd==1.2.0 #此处一定要安转这个版本的xlrd,新版的xlrd可能会出现不兼容xlsx后缀文件的情况

pip install openpyxl

三、引用xlrd读取excel数据

首先我先来选取一个测试的数据,因为在之前写过numpy和pandas的操作我们可以直接生成一个名为“test.xlsx”的文件。点击此处获取知识链接

因为工作中大部分人的excel并不像此处如此完美所以不可以直击使用pandas库进行操作,结合工作中的实际情况自行斟酌使用

import numpy as np
import pandas as pd
df = pd.dataframe(data=np.random.randint(1,90,size=[10,3]),columns=['日用户','日销售额','日成本'])
df.to_excel('test.xlsx')

学会python操作excel永不加班系列

导入xlrd包并读取数据

 学会python操作excel永不加班系列

import xlrd
#选中要读取的excel文件
test1 = xlrd.open_workbook('test.xlsx')
# 根据sheet索引获取sheet页 0表示1 1表示2 以此类推
sheet = test1.sheet_by_index(0)
# 根据sheet名称获取sheet页 0表示1 1表示2 以此类推
sheet1 = test1.sheet_by_name('sheet1')
# 打印工作表的名称、行数和列数
print("打印工作表的名称、行数和列数:")
print('名称:',sheet.name, '行数:',sheet.nrows,'列数:', sheet.ncols)
# 选中列
col = sheet.col_values(2)
print('col',col)
# 选中行
row = sheet.row_values(2)
print('row',row)
# 根据行索引选定列 注意row()中以1开始 []中以0开始
print(sheet.row(1)[2].value)

学会python操作excel永不加班系列

四、引入openpyxl写入数据  

import openpyxl
# 选中写入的excel文件
workbook=openpyxl.load_workbook('test.xlsx')
# 选中将要写入的sheet页
sheets = workbook["sheet1"]
# 给第一个单元格写入数据;
sheets["a1"] = "黑龙江省"
# 设置字体为红色;字体大小;字体为粗体;字体为斜体
from openpyxl.styles import font,colors
sheets["a1"].font = font(color='981818',size = 15,bold = true,italic = true,)
# 获取第一个单元格的内容;
print(sheets["a1"].value)
# 给任意一个单元格赋值
sheets.cell(2,1,value = "江苏省")# 保存数据,如若名称存在就覆盖 否则新建文件
workbook.save('更改后输出.xlsx')

效果如图

学会python操作excel永不加班系列

此处知识异常简单需要基本的语句操作练习即可可游刃有余。

下面推荐一个今天遇到的问题胡乱写了个demo

import openpyxl
import xlrd
# op选中文件
workbook1=openpyxl.load_workbook('test1.xlsx')
sheets=workbook1['sheet1']
# xlrd选中文件
book = xlrd.open_workbook("test1.xlsx")
# 选中sheet1
sheet = book.sheet_by_index(0)
# 单位列
dw = sheet.col_values(2)
# 数量列
nb = sheet.col_values(1)
print(dw)
# 若单位为0则乘以10000否则不变
for i in range(len(dw)):
    if dw[i]==0:
        data = sheets.cell(i+1, 2).value=nb[i]*10000
    else:
        data = sheets.cell(i+1, 2).value = nb[i]
    print(data)
# 删除单位(第三)列
sheets.delete_cols(3)
# 覆盖保存原数据
workbook1.save('test1.xlsx')

操作前

学会python操作excel永不加班系列 

操作后

学会python操作excel永不加班系列

总结

本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注的更多内容!