加载并冻结一个模型，并在PyTorch中培训其他模型

1条回答

网友

1楼 · 发布于 2024-04-26 13:52:09

是的，没错

当您按照您所解释的方式构建模型时，您所做的是正确的

ModelA由三个子模型组成：model1、models、model3

然后用model*.load_state_dict(torch.load(model*.pth))加载每个模型的权重

然后为要冻结的模型制作requires_grad=False

for param in model*.parameters():
    param.requires_grad = False

还可以通过访问子模块来冻结特定层的权重，例如，如果model1中有一个名为fc的层，则可以通过制作model1.fc.weight.requres_grad = False来冻结其权重