目录

预训练模型的finetune技巧

dp0d 收录于类别机器学习

2022-07-09 2022-07-09 约 241 字预计阅读 1 分钟

目录

权重冻结

在使用预训练语言模型进行下游任务的微调时，有时数据量难以使得其收敛，此时我们可以选择固定住某些层的参数，使其仍然保持在预训练语料上的知识积累（通常是编码器），而仅对如分类层等进行微调。

做法如下

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
# 方法1： 设置requires_grad = False
for param in model.parameters():
    param.requires_grad = False

#  方法2： torch.no_grad()
class net(nn.Module):
    def __init__():
        ......
        # 方法1可以在此设置进行初始化。
    def forward(self.x):
        with torch.no_grad():  # no_grad下参数不会迭代 
            x = self.layer(x)
            ......
        x = self.fc(x)
        return x

参考链接

https://zhuanlan.zhihu.com/p/524036087