pytorch 如何finetune

程序员文章站 2022-05-27 09:40:46

...

局部微调

有时候我们加载了训练模型后，只想调节最后的几层，其他层不训练。其实不训练也就意味着不进行梯度计算，PyTorch中提供的requires_grad使得对训练的控制变得非常简单。

model = torchvision.models.resnet18(pretrained=True)
for param in model.parameters():
    param.requires_grad = False
# 替换最后的全连接层， 改为训练100类
# 新构造的模块的参数默认requires_grad为True
model.fc = nn.Linear(512, 100)

# 只优化最后的分类层
optimizer = optim.SGD(model.fc.parameters(), lr=1e-2, momentum=0.9)

全局微调，不同学习率

有时候我们需要对全局都进行finetune，只不过我们希望改换过的层和其他层的学习速率不一样，这时候我们可以把其他层和新层在optimizer中单独赋予不同的学习速率。比如：

ignored_params = list(map(id, model.fc.parameters()))
base_params = filter(lambda p: id(p) not in ignored_params,
                     model.parameters())

optimizer = torch.optim.SGD([
            {'params': base_params},
            {'params': model.fc.parameters(), 'lr': 1e-2}
            ], lr=1e-3, momentum=0.9)

其中base_params使用1e-3来训练，model.fc.parameters使用1e-2来训练，momentum是二者共有的。

上一篇：请问php读取数字证书的有关问题

下一篇： PHP BOT实例代码

pytorch 如何finetune

局部微调

全局微调，不同学习率

如何使用html5与css3完成google涂鸦动画

三维家辅助工具如何使用？三维家辅助工具安装使用教程

南师大泰州学院如何转设？2021江苏即将合并的大学

jenkins中如何集成commander应用的完整步骤

Eclipse如何导入Maven项目详解（新手初学）

HTML5重塑Web世界它将如何改变互联网

利用spring boot如何快速启动一个web项目详解

html5 浏览器支持如何让所有的浏览器都支持HTML5标签样式

使用css3 属性如何丰富图片样式(圆角阴影渐变)

如何为Spark Application指定不同的JDK版本详解

pytorch 如何finetune

局部微调

全局微调，不同学习率

如何使用html5与css3完成google涂鸦动画

三维家辅助工具如何使用？三维家辅助工具安装使用教程

南师大泰州学院如何转设？2021江苏即将合并的大学

jenkins中如何集成commander应用的完整步骤

Eclipse如何导入Maven项目详解（新手初学）

HTML5重塑Web世界它将如何改变互联网

利用spring boot如何快速启动一个web项目详解

html5 浏览器支持 如何让所有的浏览器都支持HTML5标签样式

使用css3 属性如何丰富图片样式(圆角 阴影 渐变)

如何为Spark Application指定不同的JDK版本详解

html5 浏览器支持如何让所有的浏览器都支持HTML5标签样式

使用css3 属性如何丰富图片样式(圆角阴影渐变)