欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

【Python】Python读取mat数据集(COFW,300WLP),解析后训练模型用

程序员文章站 2022-04-16 16:20:55
...

笔者用到了人脸数据集COFW,300WLP,但文件都是mat文件,也搜了下资料,最终调通完美运行,这里记录下

Python读取文件的方式主要有两种:

由于mat文件是有MATLAB生成的,所以 7.3 以上的用方法2,版本7.3以下的用方法1,反之会报错!

  • 方法1: from scipy.io import loadmat

mat_path是mat文件的路径,格式为字符串
路径格式:
‘/media/cxx/AEDAFE58DAFE1BF11/lcswork/align_dataset/300W-LP/300W-LP/300W_LP/AFW/AFW_1051618982_1_0.mat’

c_mat = loadmat(mat_path)

打印下keys()

print(c_mat.keys())

输出结果

#dict_keys(['__header__', '__version__', '__globals__', 'pt2d', 'roi', 
# 'Illum_Para', 'Color_Para', 'Tex_Para', 'Shape_Para', 'Exp_Para', 'Pose_Para'])

这里想要获取,landmarks,先用 c_mat[‘pt2d’]得到值,再transpose,将矩阵转置,再转化成numpy格式后,再做reshape,就是想到的成对的坐标

landmarks = np.array(np.transpose(c_mat['pt2d'])).astype('float').reshape(-1, 2)

直接打印即可,格式已经是numpy了

300WLP 的图片全是jpg,加载到dataloader时,直接调取路径即可

  • 方法2:import h5py

方法2主要针对的是COFW数据集,所有的图片已经转化成矩阵存在mat结构中了,需要转换可视化

cofw_mat 是mat文件的路径,格式是字符串

c_mat = h5py.File(cofw_mat,'r')

打印下keys

print(c_mat.keys())

输出结果

<KeysViewHDF5 ['#refs#', 'IsTr', 'bboxesTr', 'phisTr']>

图片对应的key是 IsTr,打印key对应的就是图片内容,依然需要transpose

images = np.transpose(c_mat['IsTr'])

不过想要显示图片,还有一步操作,就是回去调值

image = np.transpose(train_mat[images[0]][:])
plt.imshow(image)
plt.show()

【Python】Python读取mat数据集(COFW,300WLP),解析后训练模型用
如果还要显示对应的landmarks,直接打印相应的key就可以,转置后直接可用,这时候的格式是元组(a,b)

phisTr = np.transpose(c_mat['phisTr'])

最后放上一张,批处理读取,landmarks转化为5个关键点后的图片
【Python】Python读取mat数据集(COFW,300WLP),解析后训练模型用

相关标签: 人脸