欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

YoLo卷积神经网络各层计算,卷积层计算输入的图片大小是448*448*3输出224*224*64原因?

程序员文章站 2022-04-30 16:34:17
...

YoLo卷积神经网络各层计算,卷积层计算输入的图片大小是448*448*3输出224*224*64原因?
该部分卷积层计算输入的t图片大小是4484483的,第一层卷积层,卷积核大小是77的,步长是2,pad=1,filters=64,请问输出为什么为:224224*64?
回答:此处的pad应该类似于标志位,0或非0,不一定是1.即pad=1应该是指:pad为真

看一下源码,在yolo里面pad=1的含义并不是pad=1,而是在处理的时候判断pad是否等于1,如果等于1,那pad=kernelsize/2
所以224=1+(448-1)/2
向下同理。

  int height_col = (height - ksize) / stride + 1;
    int width_col = (width - ksize) / stride + 1;
    if (pad){
        height_col = 1 + (height-1) / stride;
        width_col = 1 + (width-1) / stride;
        pad = ksize/2;
    }
    int channels_col = channels * ksize * ksize;

yolo 卷积神经网络前九层计算:
YoLo卷积神经网络各层计算,卷积层计算输入的图片大小是448*448*3输出224*224*64原因?

相关标签: 图像视觉