欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

paddlex目标检测里数据预处理部分

程序员文章站 2022-03-23 09:13:29
它的 game.zip 里是 类似于 两个文件夹,一个lable 相当于Annotations ,一个train1 文件夹 相当于 JPEGImages!unzip game.zip!mv game data/解压完之后移动到data 文件夹#根据PaddlexX格式的要求,生成三个数据集import osimport zipfileimport xml.etree.ElementTree as ETimport reimport num......

它的 game.zip 里是 类似于

paddlex目标检测里数据预处理部分     paddlex目标检测里数据预处理部分     paddlex目标检测里数据预处理部分

两个文件夹,一个 lable 相当于 Annotations ,一个 train1 文件夹 相当于 JPEGImages

!unzip game.zip
!mv game data/

解压完之后移动到  data 文件夹

#根据PaddlexX格式的要求,生成三个数据集
import os
import zipfile
import xml.etree.ElementTree as ET
import re
import numpy as np

lables = os.listdir("data/game/lable")
print("lables:",len(lables))
trains = os.listdir("data/game/train1")
print("trains:",len(trains))
_lable = []
ratio = 0.8
offset = int(len(lables)*ratio)
np.random.shuffle(lables)
path = "data/game/"
with open(path + "train_list.txt","w") as f:
    for lable in lables[:offset]:
        if lable.split(".")[0] + ".jpg" in trains:
            f.w

本文地址:https://blog.csdn.net/txpp520/article/details/107873345