【深度学习笔记】torch.nn.Sequential(* args) 与 torch.nn.Module
程序员文章站
2024-03-24 23:48:34
...
前言
- 二者主要是用于搭建神经网络。
- 使用类(继承torch.nn.Moudule)可以实现灵活搭建。
- 使用 torch.nn.Sequential 可以实现快速搭建。
一、class torch.nn.Sequential(* args)
- 一个时序容器。Modules 会以他们传入的顺序被添加到容器中。
- 因此,都贱神经网络模型的时候必须确保前一个模块的输出大小和下一个模块的输入大小是一致的。
- 当然,也可以传入一个OrderedDict。
- 为了更容易的理解如何使用Sequential, 下面给出了一个例子:
# Example of using Sequential
model = nn.Sequential(
nn.Conv2d(1,20,5),
nn.ReLU(),
nn.Conv2d(20,64,5),
nn.ReLU()
)
# Example of using Sequential with OrderedDict
model = nn.Sequential(OrderedDict([
('conv1', nn.Conv2d(1,20,5)),
('relu1', nn.ReLU()),
('conv2', nn.Conv2d(20,64,5)),
('relu2', nn.ReLU())
]))
二、class torch.nn.Module
-
所有网络的基类。
-
我们的模型也应该继承这个类。
-
Modules也可以包含其它Modules,允许使用树结构嵌入他们。我们可以将子模块赋值给模型属性。
-
init中定义每个神经层的神经元个数,和神经元层数;
-
forward是继承nn.Moudule中函数,来实现前向反馈(加上**函数) 。
import torch.nn as nn
import torch.nn.functional as F
class Model(nn.Module):
def __init__(self):
super(Model, self).__init__()
self.conv1 = nn.Conv2d(1, 20, 5) # submodule: Conv2d
self.conv2 = nn.Conv2d(20, 20, 5)
def forward(self, x):
x = F.relu(self.conv1(x))
return F.relu(self.conv2(x))
- 通过上面方式赋值的submodule会被注册。当调用 .cuda() 的时候,submodule的参数也会转换为cuda Tensor。
- 抽象出的模板如下(使用的是子类化的方式定义神经网络模型):
class 神经网络模型名字(nn.Module):
# 定义初始化函数,在类实例化时会自动调用,其中self 代表的是类的实例
# 类似于c++中的默认构造函数
def __init__(self, 参数列表):
super(神经网络模型名字, self).__init__()
self.layer1 = nn.Linear(num_input, num_hidden)
self.layer2 = nn.Sequential(...)
...
以上主要是定义需要用的网络层
# 定义前向传播函数
def forward(self, x):
x1 = self.layer1(x)
x2 = self.layer2(x)
x = x1 + x2
...
return x
三、二者的区别
import torch.nn as nn
import torch.nn.functional as F
class Net(nn.Module):
def __init__(self, n_feature, n_hidden, n_output):
# 继承__init__函数
super(Net, self).__init__()
# 定义网络的各层
self.hidden = nn.Linear(n_feature, n_hidden)
self.predict = nn.Linear(n_hidden, n_output)
# 实现所有层的连接关系。
def forward(self, x):
# 输入x首先在隐藏层经过激励函数的计算
x = F.relu(self.hidden(x))
# 输出层输出预测值
x = self.predict(x)
return x
net1 = Net(1, 10, 1)
print(net1)
print(type(net1))
# 快速搭建神经网络:Sequential方式
# 模板:网络名称 = torch.nn.Sequential()
net2 = nn.Sequential(
nn.Linear(1, 10),
nn.ReLU(),
nn.Linear(10, 1)
)
print(net2)
print(type(net2))
- 输出结果
Net(
(hidden): Linear(in_features=1, out_features=10, bias=True)
(predict): Linear(in_features=10, out_features=1, bias=True)
)
<class '__main__.Net'>
Sequential(
(0): Linear(in_features=1, out_features=10, bias=True)
(1): ReLU()
(2): Linear(in_features=10, out_features=1, bias=True)
)
<class 'torch.nn.modules.container.Sequential'>
上一篇: (蓝牙低功耗)BLE
下一篇: TensorFlow正弦函数预测
推荐阅读
-
【深度学习笔记】torch.nn.Sequential(* args) 与 torch.nn.Module
-
深度学习花书 笔记3 - 矩阵对角化、奇异值分解(SVD)、极大似然估计、误差的高斯分布与最小二乘估计的等价性、PCA原理与推导
-
深度学习与PyTorch笔记2
-
Coursera吴恩达《神经网络与深度学习》课程笔记(3)-- 神经网络基础之Python与向量化
-
深度学习笔记(一)深度学习入门——基于Python的理论与实现
-
深度学习编程作业与算法相关函数笔记
-
c#学习笔记-深度复制 与浅度复制
-
《动手学深度学习》task1——线性回归、softmax与分类模型,多层感知机笔记
-
神经网络与深度学习学习笔记:实现单隐层的神经网络
-
#数据结构与算法学习笔记#PTA18:图(邻接表)+DFS(深度优先搜索)+BFS(广度优先搜索)(C/C++)