神经网络VGGNet训练CIFAR10数据集
程序员文章站
2022-07-07 22:53:34
...
VGG网络结构
基本的单元(vgg_block)是几个卷积再加上一个池化,这个单元结构反复出现,用一个函数封装(vgg_stack).
import numpy as np
import torch
from torch import nn
from torch.autograd import Variable
from torchvision.datasets import CIFAR10
from torchvision import transforms
import torch.nn.functional as F
from utils import train
def vgg_block(num_convs, in_channels, out_channels):
net = [nn.Conv2d(in_channels, out_channels, kernel_size=3, padding=1),
nn.ReLU(True)] # 定义第一层卷积层
for i in range(num_convs-1): # 定义后面的num_convs-1层卷积层
net.append(nn.Conv2d(out_channels, out_channels, kernel_size=3, padding=1))
net.append(nn.ReLU(True))
net.append(nn.MaxPool2d(2, 2)) # 定义池化层
return nn.Sequential(*net)
# 每个vgg_block的卷积层层数是num_convs,输入、输出通道数保存在channels中
def vgg_stack(num_convs, channels):
net = []
for n, c in zip(num_convs, channels):
in_c = c[0]
out_c = c[1]
net.append(vgg_block(n, in_c, out_c))
return nn.Sequential(*net)
# 定义一个vgg结构,其中有五个卷积层,每个vgg_block的卷积层分别是1,1,2,2,2
# 每个模块的输入、输出通道数如下
vgg_net = vgg_stack((1, 1, 2, 2, 2), ((3, 64), (64, 128), (128, 256), (256, 512), (512, 512)))
# print(vgg_net)
class vgg(nn.Module):
def __init__(self):
super(vgg, self).__init__()
self.feature = vgg_net
self.fc = nn.Sequential(
nn.Linear(512, 100),
nn.ReLU(True),
nn.Linear(100, 10)
)
def forward(self, x):
x = self.feature(x)
x = x.view(x.shape[0], -1)
x = self.fc(x)
return x
def data_tf(x):
x = np.array(x, dtype='float32') / 255
x = (x-0.5)/0.5 # 标准化
x = x.transpose((2, 0, 1)) # 将channel放到第一维,只是pytorch要求的输入方式
x = torch.from_numpy(x)
return x
train_set = CIFAR10('./data', train=True, transform=data_tf, download=False)
train_data = torch.utils.data.DataLoader(train_set, batch_size=128, shuffle=True)
test_set = CIFAR10('./data', train=False, transform=data_tf, download=False)
test_data = torch.utils.data.DataLoader(test_set, batch_size=128, shuffle=False)
net = vgg().cuda()
optimizer = torch.optim.SGD(net.parameters(), lr=1e-2)
criterion = nn.CrossEntropyLoss()
train(net, train_data, test_data, 20, optimizer, criterion)
上述代码用的batch_size是128,训练一次数据集大概需要三分钟多,如果改成64,大概需要五分钟多。
训练结果:
训练到第八次的时候,训练集的准确率就达到了99.1%,测试集达到了98.9%
推荐阅读
-
对sklearn的使用之数据集的拆分与训练详解(python3.6)
-
基于jupyter notebook的python编程(Win10通过OpenCv-3.4.1进行人脸口罩数据集的模型训练并进行戴口罩识别检测)
-
详解tensorflow训练自己的数据集实现CNN图像分类
-
Mobilenetv3-ssd训练VOC格式数据集loss出现nan:数据本身出现问题
-
利用鸢尾花数据集直观感受神经网络表征能力(pytorch)
-
python 划分数据集为训练集和测试集的方法
-
Tensorflow 训练自己的数据集将数据直接导入到内存
-
深度学习 从零开始 —— 神经网络数学基础(一),学习Keras库的使用,神经网络简单流程,MNIST数据集使用
-
BP神经网络基于TensorFlow的mnist数据集分类
-
人脸口罩数据集的模型训练以及戴口罩识别检测