图像基础操作(侧重Numpy)-OpenCV_Python编程
作者:Irain
QQ:2573396010
微信:18802080892
GitHub链接:https://github.com/Irain-LUO/OpenCV-Python
目录
1 目标
- 访问像素值并对其进行修改
- 访问图像属性
- 设置感兴趣区域(ROI)
- 拆分和合并图像
- 设置图像边框(填充)
- 图像基础操作(侧重Numpy)官方链接
- Matplotlib使用手册链接
本节中的几乎所有操作都主要与Numpy相关,而不是OpenCV。要使用OpenCV编写更好的优化代码,需要Numpy的丰富知识。
(示例将在Python终端中显示,因为其中大多数只是单行代码)
2 图像基础操作(侧重Numpy)
2.1 访问像素值并对其进行修改
2.1.1 加载图片
import numpy as np
import cv2 as cv
img = cv.imread('dog.jpg')
可以通过像素值的行和列坐标来访问它。对于BGR图像,它将返回一个蓝色,绿色,红色值的数组。对于灰度图像,仅返回相应的强度。
2.1.2 访问其中一个像素和绿色像素。
px = img[0,0]
px
Green = img[0,0,1]
Green
2.1.3 修改像素
img[0,0] = [0,0,0]
img[0,0]
警告
- Numpy是用于快速数组计算的优化库。
因此,简单地访问每个像素值并对其进行修改将非常缓慢,因此不建议使用。注意上面的方法通常用于选择数组的区域,例如前5行和后3列。对于单个像素访问,Numpy数组方法array.item()和array.itemset()被认为更好。但是,它们始终返回标量,因此,如果要访问所有B,G,R值,则需要为每个值分别调用array.item()。
2.1.4 更好的像素访问和编辑方法:
img.item(0,0,0) # 访问某个颜色像素(B、G、R)
img.itemset((0,0,0),255) # 修改某个颜色像素(B、G、R)
img.item(0,0,0)
提醒
- 不能访问一个完整像素。
2.2 访问图像属性
图像属性包括行数,列数和通道数;图像数据类型;像素数;等等。图像的形状可以通过img.shape访问。它返回行,列和通道数的元组(如果图像是彩色的):
img.shape # 访问图像形状
注意
- 如果图像是灰度的,则返回的元组仅包含行数和列数,因此这是检查加载的图像是灰度还是彩色的好方法。
总像素数由img.size访问:
img.size # 访问总像素数
图片数据类型是通过img.dtype获取的:
img.dtype # 访问图片数据类型
注意
- img.dtype在调试时非常重要,因为OpenCV-Python代码中的大量错误是由无效的数据类型引起的。
2.3 设置感兴趣区域(ROI)
有时,您将不得不使用图像的某些区域。对于图像中的眼睛检测,首先要在整个图像上进行面部检测。当获得一张脸时,我们仅选择脸部区域并在其中搜索眼睛,而不是搜索整个图像。它提高了准确性(因为眼睛总是在脸上)和性能(因为我们在较小的区域搜索)。使用Numpy索引再次获得ROI。
在这里,我要选择狗的鼻子并将其复制到狗的头额上:
nouse = img[295:365,375:445]
img[100:170,275:345] = nouse
cv.imshow('dog',img)
cv.waitKey(100)
2.4 拆分和合并图像
有时您需要在图像的B,G,R通道上单独工作。在这种情况下,您需要将BGR图像拆分为单个通道。在其他情况下,您可能需要加入这些单独的渠道来创建BGR图像。您可以通过以下方式简单地执行此操作:
b,g,r = cv.split(img) # 拆分图像
image = cv.merge((b,g,r)) # 合并图像
blue = img[:,:,0] # 获得所有蓝色像素
假设要将所有红色像素都设置为零-不需要先拆分通道。 numpy索引速度更快:
img[0,0,2] = 0
img[1,0:10,2]
警告
- cv.split()是一项昂贵的操作(就时间而言)。因此,仅在必要时使用它。否则请进行Numpy索引。
2.5 设置图像边框(填充)
如果要在图像周围创建边框(如相框),则可以使用cv.copyMakeBorder()。但是它在卷积运算,零填充等方面有更多应用。此函数采用以下参数:
- src-输入图像。
- top, bottom, left, right-边框宽度(在相应方向上以像素数表示)。
- borderType-定义要边框类型的标志添加。它可以是以下类型:
- cv.BORDER_CONSTANT-添加恒定的彩色边框。该值应作为下一个参数给出。
- cv.BORDER_REFLECT-边框将是边框元素的镜像,例如:fedcba | abcdefgh | hgfedcb 。
- cv.BORDER_REFLECT_101或cv.BORDER_DEFAULT-与上面相同,但略有不同,例如:gfedcb | abcdefgh | gfedcba 。
- cv.BORDER_REPLICATE-最后一个元素被复制,像这样:aaaaaa | abcdefgh | hhhhhhh 。
- cv.BORDER_WRAP-无法解释,看起来像这样:cdefgh | abcdefgh | abcdefg。
- value-如果边框类型为cv.BORDER_CONSTANT时,边框的颜色是value。
-
copyMakeBorder方法使用手册链接
演示所有这些边框类型的示例代码,以便更好地理解(考虑jupyte notebook环境使用):
import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
BLUE = [255,0,0]
img1 = cv.imread('opencv-logo.jpg')
replicate = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_REPLICATE)
reflect = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_REFLECT)
reflect101 = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_REFLECT_101)
wrap = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_WRAP)
constant= cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_CONSTANT,value=BLUE)
plt.xticks([]), plt.yticks([]) # 在 X 轴和 Y 轴上隐藏刻度值
plt.subplot(231),plt.imshow(img1,'gray'),plt.title('ORIGINAL')
plt.xticks([]), plt.yticks([]) # 在 X 轴和 Y 轴上隐藏刻度值
plt.subplot(232),plt.imshow(replicate,'gray'),plt.title('REPLICATE')
plt.xticks([]), plt.yticks([]) # 在 X 轴和 Y 轴上隐藏刻度值
plt.subplot(233),plt.imshow(reflect,'gray'),plt.title('REFLECT')
plt.xticks([]), plt.yticks([]) # 在 X 轴和 Y 轴上隐藏刻度值
plt.subplot(234),plt.imshow(reflect101,'gray'),plt.title('REFLECT_101')
plt.xticks([]), plt.yticks([]) # 在 X 轴和 Y 轴上隐藏刻度值
plt.subplot(235),plt.imshow(wrap,'gray'),plt.title('WRAP')
plt.xticks([]), plt.yticks([]) # 在 X 轴和 Y 轴上隐藏刻度值
plt.subplot(236),plt.imshow(constant,'gray'),plt.title('CONSTANT')
plt.xticks([]), plt.yticks([]) # 在 X 轴和 Y 轴上隐藏刻度值
plt.show()
请参阅下面的结果。 (图像与matplotlib一起显示。因此红色和蓝色通道将互换):
发表:2020年7月2日
本文地址:https://blog.csdn.net/weixin_42122125/article/details/107081384
上一篇: python爬虫实例
下一篇: linux使用微软鼠标第4、5键的方法