【Python】Python读取mat数据集(COFW,300WLP),解析后训练模型用
程序员文章站
2022-04-16 16:20:55
...
笔者用到了人脸数据集COFW,300WLP,但文件都是mat文件,也搜了下资料,最终调通完美运行,这里记录下
Python读取文件的方式主要有两种:
由于mat文件是有MATLAB生成的,所以 7.3 以上的用方法2,版本7.3以下的用方法1,反之会报错!
- 方法1: from scipy.io import loadmat
mat_path是mat文件的路径,格式为字符串
路径格式:
‘/media/cxx/AEDAFE58DAFE1BF11/lcswork/align_dataset/300W-LP/300W-LP/300W_LP/AFW/AFW_1051618982_1_0.mat’
c_mat = loadmat(mat_path)
打印下keys()
print(c_mat.keys())
输出结果
#dict_keys(['__header__', '__version__', '__globals__', 'pt2d', 'roi',
# 'Illum_Para', 'Color_Para', 'Tex_Para', 'Shape_Para', 'Exp_Para', 'Pose_Para'])
这里想要获取,landmarks,先用 c_mat[‘pt2d’]得到值,再transpose,将矩阵转置,再转化成numpy格式后,再做reshape,就是想到的成对的坐标
landmarks = np.array(np.transpose(c_mat['pt2d'])).astype('float').reshape(-1, 2)
直接打印即可,格式已经是numpy了
300WLP 的图片全是jpg,加载到dataloader时,直接调取路径即可
- 方法2:import h5py
方法2主要针对的是COFW数据集,所有的图片已经转化成矩阵存在mat结构中了,需要转换可视化
cofw_mat 是mat文件的路径,格式是字符串
c_mat = h5py.File(cofw_mat,'r')
打印下keys
print(c_mat.keys())
输出结果
<KeysViewHDF5 ['#refs#', 'IsTr', 'bboxesTr', 'phisTr']>
图片对应的key是 IsTr,打印key对应的就是图片内容,依然需要transpose
images = np.transpose(c_mat['IsTr'])
不过想要显示图片,还有一步操作,就是回去调值
image = np.transpose(train_mat[images[0]][:])
plt.imshow(image)
plt.show()
如果还要显示对应的landmarks,直接打印相应的key就可以,转置后直接可用,这时候的格式是元组(a,b)
phisTr = np.transpose(c_mat['phisTr'])
最后放上一张,批处理读取,landmarks转化为5个关键点后的图片