欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Opencv 读取灰度图像会识别为3通道问题

程序员文章站 2024-01-20 16:51:46
...

最近初接触图像cv,一切都是从零开始因此遇到了许多问题,故在此记录遇到的问题方便提醒自己也方便后来人不再困惑。


场景:

我们都知道灰度图或者红外图都是单通道图片,而彩色图片是三通道图片。但是当我们用img.shape读取灰度图/红外图片的时候返回的却是三通道结果:

import cv2

img_path = r'灰度图'
img = cv2.imread(img_path)
print(img.shape) 

# 如果我将图片灰度处理
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
print(gray.shape)

"""
img.shape返回的结果:
(201, 190, 3)
gray.shape返回的结果:
(201, 190)
"""

问题在于我们直接用opencv 读取图片时似乎都是三通道图片,只有在灰度处理后才回显示单通道。针对这一问题我查了些资料:

opencv在默认情况下会读取带有3个通道的图像,如果是灰度图/红外图片则会将其图层复制三次(RGB缺省),因此读出来的图片是三通道。


解决:

如果我们想一开始就按照单通道读取灰度图片/红外图片的话,可以在imread()函数中加入相关参数(cv2.IMREAD_GRAYSCALE):

import cv2

img_path = r'灰度图'
img = cv2.imread(img_path, cv2.IMREAD_GRAYSCALE)
print(img.shape)

"""
img.shape返回的结果:
(201, 190)
"""

 这样就会直接按照单通道的方式读取。


需求:

现有一堆彩色图与灰度图混合文件,要求将其分类。

在不考虑效率的情况下,我用这种方式处理:

def handle_img(file_path):
    for img_path in sorted(glob.glob(file_path + "/*.jpg)):
        print("正在处理:" , img_path)
        img = Image.open(img_path)
        pix = img.convert('RGB')
        width = img.size[0]
        height = img.size[1]
        ir = 0
        hd = 0
        for x in range(width):
            for y in range(height):
                r,g,b = pix.getpixel((x,y))
                r = int(r)
                g = int(g)
                b = int(b)
                if r==g==b:
                    ir += 1
                else:
                    hd += 1
        if ir > hd:
            # 此图片为灰度图
        else:
            # 此图片为彩色图

注: 此小脚本在我的场景下实现了图片分类,但是尚未大范围测试。该方法只是起到抛砖引玉的作用启发观看者。