paddlex目标检测里数据预处理部分

程序员文章站 2022-03-23 09:13:29

它的 game.zip 里是类似于两个文件夹，一个lable 相当于Annotations ，一个train1 文件夹相当于 JPEGImages!unzip game.zip!mv game data/解压完之后移动到data 文件夹#根据PaddlexX格式的要求，生成三个数据集import osimport zipfileimport xml.etree.ElementTree as ETimport reimport num......

它的 game.zip 里是类似于

paddlex目标检测里数据预处理部分

两个文件夹，一个 lable 相当于 Annotations ，一个 train1 文件夹相当于 JPEGImages

!unzip game.zip
!mv game data/

解压完之后移动到 data 文件夹

#根据PaddlexX格式的要求，生成三个数据集
import os
import zipfile
import xml.etree.ElementTree as ET
import re
import numpy as np

lables = os.listdir("data/game/lable")
print("lables:",len(lables))
trains = os.listdir("data/game/train1")
print("trains:",len(trains))
_lable = []
ratio = 0.8
offset = int(len(lables)*ratio)
np.random.shuffle(lables)
path = "data/game/"
with open(path + "train_list.txt","w") as f:
    for lable in lables[:offset]:
        if lable.split(".")[0] + ".jpg" in trains:
            f.w

本文地址：https://blog.csdn.net/txpp520/article/details/107873345

paddlex目标检测里数据预处理部分

它的 game.zip 里是 类似于

两个文件夹，一个 lable 相当于 Annotations ，一个 train1 文件夹 相当于 JPEGImages

解压完之后移动到 data 文件夹

paddlex目标检测里数据预处理部分

paddlex目标检测里数据预处理部分

它的 game.zip 里是类似于

两个文件夹，一个 lable 相当于 Annotations ，一个 train1 文件夹相当于 JPEGImages