python 使用openpyxl读取excel数据

程序员文章站 2023-01-13 16:19:25

openpyxl介绍 openpyxl是一个开源项目，它是一个用于读取/写入excel 2010文档（如xlsx 、xlsm 、xltx 、xltm文件）的python库，如果要处理更...

openpyxl介绍

openpyxl是一个开源项目，它是一个用于读取/写入excel 2010文档（如xlsx 、xlsm 、xltx 、xltm文件）的python库，如果要处理更早格式的excel文档（xls），需要用到其它库（如：xlrd、xlwt等），这是openpyxl比较其他模块的不足之处。openpyxl是一款比较综合的工具，不仅能够同时读取和修改excel文档，而且可以对excel文件内单元格进行详细设置，包括单元格样式等内容，甚至还支持图表插入、打印设置等内容。

python中与excel操作相关的模块：

???? xlrd库：从excel中读取数据，支持xls、xlsx格式
???? xlwt库：对excel进行修改操作，但不支持对xlsx格式的修改
???? xlutils库：在xlwt和xlrd中，对一个已存在文件进行修改
???? openpyxl库：主要针对xlsx格式的excel进行读取和编辑

openpyxl安装

pip install openpyxl

openpyxl基本概念

workbook：工作簿对象
sheet：表单对象
cell：表格对象

也就是我们使用excel时可以看到的三个对象，我们操作excel的步骤是打开工作簿，选中表单，对单元格进行操作，而openpyxl的工作原理也是如此。

python 使用openpyxl读取excel数据

openpyxl对excel进行操作

新建excel

import openpyxl

# 创建一个工作簿
workbook = openpyxl.workbook()
# 创建一个表单
sheet = workbook.create_sheet('表单1')
# 写入一个数据
sheet.cell(row=1, column=1, value="python")
# 保存
workbook.save('test.xlsx')

???? 注意点：如果保存的文件名已存在，将会覆盖原来的文件

打开已存在的文件

打开已存在的文件：load_workbook()
获取表单：workbook['表单名']
读取指定表格：cell(row, column).value

import openpyxl

# 打开工作簿
workbook = openpyxl.load_workbook('test.xlsx')
# 获取表单
sheet = workbook['表单1']
# 读取指定的单元格数据
cell = sheet.cell(row=1, column=1).value
print(cell)

运行结果：

c:\software\python\python.exe d:/learn/python24/python_base/test.py
python

process finished with exit code 0

读取单个单元格

# 方式一：读取a6单元格的值
cell1 = sheet['a6'].value

# 方式二：读取第3行,第4列单元格的值
cell2 = sheet.cell(row=3, column=4).value

读取多个单元格

# 方式一：读取a6单元格的值
cell1 = sheet['a6'].value

# 方式二：读取第3行,第4列单元格的值
cell2 = sheet.cell(row=3, column=4).value

读取多个单元格时，都是以元组的形式返回

其他相关操作

关键代码	相关描述
cell(row, column, value)	写入数据，三个参数分别是行，列，值
cell(row, column).value	获取指定单元格的值，两个参数分别是行，列
workbook.remove('表单名')	删除表单
del workbook['表单名']	删除表单
workbook.save('文件名')	保存工作簿
sheet.max_row	获取表单数据的总行数
sheet.max_column	获取表单数据的总列数
sheet.rows	获取按行所有的数据
sheet.columns	获取按列所有的数据

???? 注意点：

openpyxl中列和行的起始标识都是1，不是从0开始
从excel中读取出来的数据只有两种类型，即数值类型和字符串类型
不要随便在表格中敲空格，会影响判断最大行数和最大列数
运行操作excel的代码时，要先关闭在操作系统中打开的相关excel表，否则可能会无法读取/写入数据
写入数据时要执行保存

import openpyxl

# 打开工作簿
wb = openpyxl.load_workbook('test.xlsx')
# 获取表单
sh = wb['表单1']
# 读取指定的单元格数据
res1 = sh.cell(row=1, column=1).value
print(res1)

# 获取最大行数
print(sh.max_row)
# 获取最大列数
print(sh.max_column)

# 按列读取所有数据，每一列的单元格放入一个元组中
print(sh.columns) # 直接打印，打印结果是一个可迭代对象，我们可以转换成列表来查看

# 按行读取所有数据，每一行的单元格放入一个元组中
rows = sh.rows
# print(list(rows)) # 转换成列表之后打印结果为具体的单元格，如下
# [(<cell '表单1'.a1>, <cell '表单1'.b1>, <cell '表单1'.c1>, <cell '表单1'.d1>, <cell '表单1'.e1>, <cell '表单1'.f1>, <cell '表单1'.g1>),
# (<cell '表单1'.a2>, <cell '表单1'.b2>, <cell '表单1'.c2>, <cell '表单1'.d2>, <cell '表单1'.e2>, <cell '表单1'.f2>, <cell '表单1'.g2>),
# (<cell '表单1'.a3>, <cell '表单1'.b3>, <cell '表单1'.c3>, <cell '表单1'.d3>, <cell '表单1'.e3>, <cell '表单1'.f3>, <cell '表单1'.g3>)]


# 我们可以通过for循环以及value来查看单元格的值
for row in list(rows): # 遍历每行数据
 case = [] # 用于存放一行数据
 for c in row: # 把每行的每个单元格的值取出来，存放到case里
  case.append(c.value)
 print(case)

运行结果：

c:\software\python\python.exe d:/learn/python24/python_base/test.py
case_id
3
7
<generator object worksheet._cells_by_col at 0x0000012fef90d8b8>
['case_id', 'interface', 'title', 'method', 'url', 'data', 'expected']
[1, 'login', '登录成功', 'post', '/member/login', '{"mobile_phone":"15692004245","pwd":"miki12345"}', "{'code': 0, 'msg': 'ok'}"]
[2, 'login', '登录失败-手机号为空', 'post', '/member/login', '{"mobile_phone":"","pwd":"miki12345"}', "{'code': 2, 'msg': '手机号码为空'}"]

excel表中的原数据如下图：

python 使用openpyxl读取excel数据

openpyxl封装

在测试过程中，我们会经常需要访问excel读取测试数据，如果毎访问一次我们就调用一次openpyxl，进行打开excel，选取表单，读取数据等操作，将会增加我们的工作量和代码量。凡是需要重复使用的，我们都可以对它进行二次封装，写成我们自己的版本，还可以在封装过程中加入我们想要的内容，使用的时候直接调用即可。

在封装openpyxl时，读取excel时我写了两种实现方法，第一种是读取数据后，把每条测试数据的键值保存到一个字典中，再把字典存到一个列表，这种方式比较容易理解，但是调用的时候需要多敲几个括号或者引号；第二种是把每条测试数据的键值存到一个实例对象的属性中，再把每个实例存到一个列表。实际上他们的作用是一样，只是第二种方式调用时更简单。

# read_excel.py
import openpyxl


class casesdata:
 """用于保存测试用例数据"""
 pass


class readexcel:

 def __init__(self, file_name, sheet_name):
  self.file_name = file_name
  self.sheet_name = sheet_name

 def open(self):
  self.wb = openpyxl.load_workbook(self.file_name)
  self.sh = self.wb[self.sheet_name]

 def close(self):
  self.wb.close()

 def read_data(self):
  """按行读取数据，最后返回一个存储字典的列表"""
  self.open()
  rows = list(self.sh.rows)
  titles = []
  for t in rows[0]:
   title = t.value
   titles.append(title)
  cases = []
  for row in rows[1:]:
   case = []
   for r in row:
    case.append(r.value)
   cases.append(dict(zip(titles, case))) # 通过zip聚合打包用例的标题和数据
  self.close()
  return cases

 def read_data_obj(self):
  """按行读取数据，最后返回的是一个存储实例对象的列表"""
  self.open()
  rows = list(self.sh.rows)
  titles = []
  for t in rows[0]:
   title = t.value
   titles.append(title)
  cases = []
  for row in rows[1:]:
   case_obj = casesdata() # 创建一个对象用来保存该行用例数据
   case = []
   for r in row:
    case.append(r.value)
   case_info = dict(zip(titles, case))
   for k, v in case_info.items():
    setattr(case_obj, k, v)
   cases.append(case_obj)
  self.close()
  return cases

 def write_data(self, row, column, msg):
  self.open()
  self.sh.cell(row=row, column=column, value=msg)
  self.wb.save(self.file_name)
  self.close()


if __name__ == '__main__':
 # 直接运行本文件时执行，下面是一个应用实例
 # 需要读取excel时直接调用readexcel类
 test = readexcel('cases.xlsx', 'login')
 res = test.read_data_obj()	# 最后返回的是一个存储实例对象的列表
 print(res[0].case_id)	# 打印第1个用例的case_id
 print(res[3].title)		# 打印第4个用例的title
 
 test2 = readexcel('cases.xlsx', 'login')
 res2 = test2.read_data()	# 最后返回一个存储字典的列表
 print(res2[0]['case_id'])	# 打印第1个用例的case_id
 print(res2[3]['title'])		# 打印第4个用例的title

上面封装的openpyxl中，应用实例的excel表结构如下：

python 使用openpyxl读取excel数据

以上就是python 使用openpyxl读取excel数据的详细内容，更多关于python openpyxl读取excel数据的资料请关注其它相关文章！

python 使用openpyxl读取excel数据

openpyxl介绍

openpyxl安装

openpyxl基本概念

openpyxl对excel进行操作

新建excel

打开已存在的文件

读取单个单元格

读取多个单元格

其他相关操作

openpyxl封装

.NET Core 使用NPOI读取Excel返回泛型List集合

在python操作数据库中游标的使用方法

python数据库操作常用功能使用详解(创建表/插入数据/获取数据)

C#使用NPOI将List数据导出到Excel文档

Python使用Selenium爬取淘宝异步加载的数据方法

python3 json数据格式的转换(dumps/loads的使用、dict to str/str to dict、json字符串/字典的相互转换)

使用Python在Excel中嵌入附件（txt文件，zip压缩包）对象

python数据持久存储 pickle模块的基本使用方法解析

对sklearn的使用之数据集的拆分与训练详解(python3.6)

Python实现读取SQLServer数据并插入到MongoDB数据库的方法示例