Pytorch 在训练过程中实现学习率衰减

程序员文章站 2022-07-13 12:41:33

...

在网络的训练过程中，学习率是一个非常重要的超参数，它直接影响了网络的训练效果。但过大的学习率将会导致网络无法达到局部最小点，使得训练结果震荡，准确率无法提升，而过小的学习率将会导致拟合速度过慢，浪费大量的时间和算力。因此我们希望在训练之初能够有较大的学习率加快拟合的速率，之后降低学习率，使得网络能够更好的达到局部最小，提高网络的效率。

torch.optim.lr_scheduler.LambdaLR（）

torch.optim.lr_scheduler.LambdaLR(optimizer, lr_lambda, last_epoch=-1)

其中optimizer就是包装好的优化器， lr_lambda即为操作学习率的函数。将每个参数组的学习速率设置为初始的lr乘以一个给定的函数。当last_epoch=-1时，将初始lr设置为lr。

torch.optim.lr_scheduler.StepLR（）

 torch.optim.lr_scheduler.StepLR(optimizer, step_size, gamma=0.1, last_epoch=-1)

其中optimizer就是包装好的优化器，step_size (int) 为学习率衰减期，指几个epoch衰减一次。gamma为学习率衰减的乘积因子。默认为0.1 。当last_epoch=-1时，将初始lr设置为lr。

Pytorch 在训练过程中实现学习率衰减

使用Pytorch实现学习率衰减/降低（learning rate decay）

tensorflow在训练过程中逐步减少学习率

Pytorch 在训练过程中实现学习率衰减