欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

制作自己的图像语义分割数据集

程序员文章站 2024-03-19 17:04:22
...

    本文教你如何正确制作自己的图像语义分割数据集。假设我当前目录下有500张图片,命名从1.jpg开始,一直往上递增,我事先已经调整好了图像的大小。

    首先下载Labelme工具:https://github.com/wkentaro/labelme。使用方式见教程。

    每张图片都会生成对应的json文件。接下里就是解析json文件。 以第一个样本为例,解析json文件时,在命令行输入以下进行转化:

$labelme_json_to_dataset json/1.json -o parsed/json-1

    (上面这一句中:json文件夹是存放json文件的地方,parsed文件夹是存放解析之后文件的地方)。通过刚刚这个命令,你可以在json-1子文件夹里找到5个文件,分别为:img.png/info.yaml/label.png/label_names.txt/label_viz.png。其中label.png和label_names.txt是后面将要用到的。

    但是刚刚这条语句只会转化一个json文件,因此需要写一个shell脚本进行批文件处理。在工作目录中写一个shell脚本文件,命名为test.sh,文件里的内容如下:

for ((i=1;i<501;i++));do
  labelme_json_to_dataset json/$i.json -o parsed/json-$i
done

    接下来需要在命令行里运行:

$sh test.sh

    注意,上面的命令可能会报如下的错误:

Syntax error: Bad for loop variable

    这个问题的解决方法如下,在命令行输入:

$chmod 777 test.sh

    然后在终端运行:

$./test.sh

    最后在parsed文件夹下成功生成了500个子文件夹。接下来为标注出来的label.png进行着色。现在需要写一个程序进行批量处理那500张label.png,新建一个python程序,命名为test.py,内容如下:

#-*- coding:utf-8 -*-

import PIL.Image
import numpy as np
from skimage import io,data,color
import matplotlib.pyplot as plt

for i in range(1,501):
    
    img=PIL.Image.open("parsed/json-%i/label.png"%i)
    img=np.array(img)
    dst=color.label2rgb(img,bg_label=0,bg_color=(0,0,0))#背景的标签为0,颜色为黑色。当你需要分割多个类别时,去skimage查看原函数
    io.imsave("transform/dstlabel-%i.png"%i,dst)

    最后处理的500张图片保存在transform文件夹下,你可以查看到。但是,事情还没有结束!!!

    最后一步,需要把刚刚的24位png图转化为8位png图,必须得转化。这里提供一份Matlab程序:

dirs=dir('C:/Users/xxx/Desktop/testing/transform/*.png');
for n=1:numel(dirs)
     strname=strcat('C:/Users/xxx/Desktop/testing/transform/',dirs(n).name);
     img=imread(strname);
     [x,map]=rgb2ind(img,256);
     newname=strcat('C:/Users/xxx/Desktop/testing/output/',dirs(n).name);
     imwrite(x,map,newname,'png');
end  

    最后在output文件夹下,生成最后的图像标签。接着就可以训练了。展示一组原图以及对应的标签:

                                           制作自己的图像语义分割数据集   制作自己的图像语义分割数据集