YoLo卷积神经网络各层计算,卷积层计算输入的图片大小是448*448*3输出224*224*64原因?
程序员文章站
2022-04-30 16:34:17
...
该部分卷积层计算输入的t图片大小是4484483的,第一层卷积层,卷积核大小是77的,步长是2,pad=1,filters=64,请问输出为什么为:224224*64?
回答:此处的pad应该类似于标志位,0或非0,不一定是1.即pad=1应该是指:pad为真
看一下源码,在yolo里面pad=1的含义并不是pad=1,而是在处理的时候判断pad是否等于1,如果等于1,那pad=kernelsize/2
所以224=1+(448-1)/2
向下同理。
int height_col = (height - ksize) / stride + 1;
int width_col = (width - ksize) / stride + 1;
if (pad){
height_col = 1 + (height-1) / stride;
width_col = 1 + (width-1) / stride;
pad = ksize/2;
}
int channels_col = channels * ksize * ksize;
yolo 卷积神经网络前九层计算:
上一篇: 详谈css3的动画特效之动画序列