欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

快速解决cv2.imread()读取图像为BGR的问题

程序员文章站 2022-07-09 08:19:40
opencv读取图像为b,g,r方法,比如img = cv2.imread("xx.jpg")cv2.imshow("xx",img)展示的结果是正常的:但是此时读取到的img已经为bgr方式了,如果...

opencv读取图像为b,g,r方法,比如

img = cv2.imread("xx.jpg")
cv2.imshow("xx",img)

展示的结果是正常的:

快速解决cv2.imread()读取图像为BGR的问题

但是此时读取到的img已经为bgr方式了,如果我们再用其他使用rgb方式读取的函数进行读取时就会出错,比如我用plt对图像进行显示,效果如下:

快速解决cv2.imread()读取图像为BGR的问题

因为plt函数是rgb方式读取的,所以会出错。这时我们可以手动改变img的通道顺序,如下:

b,g,r = cv2.split(img)
img_rgb = cv2.merge([r,g,b])
plt.figure()
plt.imshow(img_rgb)
plt.show()

这时img_rgb就是rgb顺序的了.那么这时再用cv2.imshow()显示出来,rgb错误:

快速解决cv2.imread()读取图像为BGR的问题

补充:盘点踩过的关于cv2 和pil 图像读取的一些小坑

1、首先像素读取顺序不同

pil 读取图像时的像素顺序是标准的rgb

from pil import image
img = image.open("test.jpg")
print img.size
print img.getpixel((0,0))

输出结果是

(533, 800)
(217, 229, 225)

cv2 读取图像时的像素顺序是标准的bgr

img = cv2.imread(""test.jpg"")
print img.shape
print img[0][0]

输出结果是

(800, 533, 3)
[225 229 217]

若要cv2读取完图像也是rgb格式,则按如下方法

img = cv2.imread(""test.jpg"")[..., ::-1]
print img.shape
print img[0][0]

输出结果是

(800, 533, 3)
[217 229 225]

和用pil 读取完的一致

2、cv2 图像读取方法的参数解释

首先我们先来看一下这个函数的定义

def imread(filename, flags=none)

filename

参数传入的是图像路径,支持解析的图像格式基本上覆盖全了

- windows bitmaps - \*.bmp, \*.dib (always supported)
- jpeg files - \*.jpeg, \*.jpg, \*.jpe (see the *note* section)
- jpeg 2000 files - \*.jp2 (see the *note* section)
- portable network graphics - \*.png (see the *note* section)
- webp - \*.webp (see the *note* section)
- portable image format - \*.pbm, \*.pgm, \*.ppm \*.pxm, \*.pnm (always supported)
- sun rasters - \*.sr, \*.ras (always supported)
- tiff files - \*.tiff, \*.tif (see the *note* section)
- openexr image files - \*.exr (see the *note* section)
- radiance hdr - \*.hdr, \*.pic (always supported)
- raster and vector geospatial data supported by gdal (see the *note* section)

flags

@param flags flag that can take values of cv::imreadmodes

flags指定了所读取图片的颜色类型, 默认值为1

对应值为 -1 到 4

参数 value
imread_unchanged if set, return the loaded image as is (with alpha channel, otherwise it gets cropped).
imread_grayscale if set, always convert image to the single channel grayscale image.
imread_color if set, always convert image to the 3 channel bgr color image.
imread_anydepth if set, return 16-bit/32-bit image when the input has the corresponding depth, otherwise convert it to 8-bit.
imread_anycolor if set, the image is read in any possible color format.
imread_load_gdal if set, use the gdal driver for loading the image.
参数 value
flag=-1时 8位深度,原通道
flag=0 8位深度,1通道
flag=1 8位深度 ,3通道
flag=2 原深度,1通道
flag=3 原深度,3通道
flag=4 8位深度 ,3通道

imread_unchanged :不进行转化,比如保存为了16位的图片,读取出来仍然为16位。

imread_grayscale :进行转化为灰度图,比如保存为了16位的图片,读取出来为8位,类型为cv_8uc1。

imread_color :进行转化为三通道图像。

imread_anydepth :如果图像深度为16位则读出为16位,32位则读出为32位,其余的转化为8位。

imread_anycolor

imread_load_gdal :使用gdal驱动读取文件,gdal(geospatial data abstraction library)是一个在x/mit许可协议下的开源栅格空间数据转换库。它利用抽象数据模型来表达所支持的各种文件格式。它还有一系列命令行工具来进行数据转换和处理。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。