欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

python批量修改xml文件的标签属性值

程序员文章站 2022-04-18 20:01:33
...

一、使用背景

之前在ubuntu下做过yolov3目标检测的项目(Pascal VOC数据集),近期ubuntu重装过,所以…标签文件中的路径都错了,labelImg无法关联图片和标签文件,对训练也有影响。
因此需要用python批量修改xml中 filename和path两个属性值
python批量修改xml文件的标签属性值
所以…找*发现了-> https://blog.csdn.net/qq_41983165/article/details/87977712
貌似有很多错误,无法直接用。但提供了很好的思路,在此感谢

以下代码,使用时要修改为自己的路径,且要保证修改前标签文件名和图片名保持一致,代码很简单,自己看吧
对其优化和修改后: 可以直接一次性替换掉,

import xml.dom.minidom
import os


path='/home/hujl/dev/darknet-master/scripts/VOCdevkit/VOC2007/Annotations' 			# 原来xml文件存放的路径
sv_path='/home/hujl/dev/darknet-master/scripts/VOCdevkit/VOC2007/Annotations1' 	# 修改后的xml文件存放路径
files=os.listdir(path)
for xmlFile in files:
	dom=xml.dom.minidom.parse(os.path.join(path,xmlFile)) 	#打开xml文件,送到dom解析
	root=dom.documentElement
	item=root.getElementsByTagName('path') 				# 获取path这一node名字及相关属性值
	a,b = os.path.splitext(xmlFile)							# 并没有取filename标签名,而直接用的文件名,保险期间还是用filename
	for i in item:
		i.firstChild.data='/home/hujl/dev/darknet-master/scripts/VOCdevkit/VOC2007/JPEGImages/'  # xml文件对应的图片路径
	with open(os.path.join(sv_path,xmlFile),'w') as fh:							
		dom.writexml(fh)					#将图片名 之前的路径全部替换

	# 在路径后面 添加图片名 如 000001.jpg
	for j in item:
		i.firstChild.data += (a + '.jpg')
	with open(os.path.join(sv_path,xmlFile),'w') as filenames:
		dom.writexml(filenames)

相关标签: python YOLOv3