pytorch卷积操作nn.Conv中的groups参数用法解释

程序员文章站 2022-07-06 16:21:26

...

最近在项目中使用到了MobileNet分类网络，MobileNet网络中使用到了深度可分离卷积操作，深度可分离卷积将传统卷积操作分成两步来处理。假设输入的特征图feature_map大小为[H, W, C]，深度可分离卷积第一步使用C组NxNx1的卷积核对每个输入通道in_channel进行卷积，卷积输出结果特征图feature_map大小为[H, W, C]，然后使用M和1x1xC的卷积核进行卷积操作，输出的特征图大小为[H, W, M]。深度可分离卷积的目的是减少卷积操作的参数量和计算量，从而提升运算速度。深度可分离卷积表示如下图：

在MobileNet网络中有一步是要对每个通道进行单独的卷积操作，在pytorch实现的MobileNetV2代码中用到了nn.Conv函数的groups参数来完成逐个通道的卷积操作，如下图：

pytorch卷积操作nn.Conv中的groups参数用法解释

查询pytorch官方文档对于groups参数的解释，看的一脸懵逼？？？大概能看出来这玩意是用来对输入channel和输出channel进行分组的，具体怎么分组，分组后怎么计算，还是一脸懵逼？？？

pytorch卷积操作nn.Conv中的groups参数用法解释

下面就自己动手来试验一下这个参数的用法：

1、首先定义卷积操作的输入数据：

# 输入数据的维度[N, C, H, W] -> [1, 4, 1, 1]
# 输出通道数4
data = torch.arange(4, dtype=torch.float32).view(1,4, 1, 1)
print(data)

自定义的输入数据长和宽都是1，有4个通道。长下面这个样子：

pytorch卷积操作nn.Conv中的groups参数用法解释

2、实验groups=1场景

kernel_weight = torch.nn.Parameter(torch.arange(16, dtype=torch.float32).view(4, 4, 1, 1))
print(kernel_weight)
conv_groups_1 = nn.Conv2d(in_channels=4, out_channels=4, kernel_size=1, groups=1, bias=False)
conv_groups_1.weight = kernel_weight
conv_groups_1(data)

这里为了方便后续卷积结果的计算，我没有使用随机数产生的卷积核，使用了自定义的卷积核，并且卷积过程中没有使用bias。输出结果如下：

pytorch卷积操作nn.Conv中的groups参数用法解释

上图中红框中的内容是4个卷积核，绿色框中的内容是卷积结果。这些结果是怎么计算得到的呢？请看下图：

pytorch卷积操作nn.Conv中的groups参数用法解释

这是groups=1的场景，groups=1时只有一个分组，所有的输入通道分别和所有的卷积核进行卷积操作，生成卷积结果。下面看一下groups=2的场景。

3、实验groups=2的场景

kernel_weight_2 = torch.nn.Parameter(torch.arange(8, dtype=torch.float32).view(4, 2, 1, 1))
print(kernel_weight_2)
conv_groups_2 = nn.Conv2d(in_channels=4, out_channels=4, kernel_size=1, groups=2, bias=False)
conv_groups_2.weight = kernel_weight_2
conv_groups_2(data)

输出结果如下：

pytorch卷积操作nn.Conv中的groups参数用法解释

结果同上，红色框中是卷积核，绿色框中是卷积输出结果，可以发现groups=2时的卷积核通道数比groups=1时卷积核的通道数减少了一半。那上图的结果又是怎么计算出来的呢？请看下图：

pytorch卷积操作nn.Conv中的groups参数用法解释

这是groups=2的场景，groups=2时有2个分组，每个分组中包含2个卷积核，每组卷积核和2个输入通道进行卷积操作得到一组输出结果，将两组输出结果进行叠加得到最终的卷积结果。下面看一下groups=4的场景。

4、实验groups=4的场景

kernel_weight_4 = torch.nn.Parameter(torch.arange(4, dtype=torch.float32).view(4, 1, 1, 1))
print(kernel_weight_4)
conv_groups_4 = nn.Conv2d(in_channels=4, out_channels=4, kernel_size=1, groups=4, bias=False)
conv_groups_4.weight = kernel_weight_4
conv_groups_4(data)

输出结果如下：

pytorch卷积操作nn.Conv中的groups参数用法解释