paddlex目标检测里数据预处理部分
程序员文章站
2022-06-22 23:09:20
它的 game.zip 里是 类似于 两个文件夹,一个lable 相当于Annotations ,一个train1 文件夹 相当于 JPEGImages!unzip game.zip!mv game data/解压完之后移动到data 文件夹#根据PaddlexX格式的要求,生成三个数据集import osimport zipfileimport xml.etree.ElementTree as ETimport reimport num......
它的 game.zip 里是 类似于
两个文件夹,一个 lable 相当于 Annotations ,一个 train1 文件夹 相当于 JPEGImages
!unzip game.zip
!mv game data/
解压完之后移动到 data 文件夹
#根据PaddlexX格式的要求,生成三个数据集
import os
import zipfile
import xml.etree.ElementTree as ET
import re
import numpy as np
lables = os.listdir("data/game/lable")
print("lables:",len(lables))
trains = os.listdir("data/game/train1")
print("trains:",len(trains))
_lable = []
ratio = 0.8
offset = int(len(lables)*ratio)
np.random.shuffle(lables)
path = "data/game/"
with open(path + "train_list.txt","w") as f:
for lable in lables[:offset]:
if lable.split(".")[0] + ".jpg" in trains:
f.w
本文地址:https://blog.csdn.net/txpp520/article/details/107873345