PyTorch：保存权重和模型定义

2条回答

网友

1楼 · 编辑于 2024-04-26 11:50:30

@D Hudson's answer是正确的选择。但是，为了将来的参考，我想添加以下对我有用的方法

让我们假设模型的forward方法是固定的，也就是说，只改变了底层架构，输入和；输出形状。在本例中，我们只对表示整个体系结构的Sequential属性感兴趣：

class Model(nn.Module):
    def __init__(self, **hparams):
        super(Model, self).__init__()
        
        # this attribute is the only thing we care about
        self.net = nn.Sequential(
            # experiment with different layers here ...
        )
        
    def forward(self, x):
        return self.net(x) # this is fixed!

然后，我们可以保存模型架构（基本上只是net属性）及其权重：

m = Model()
# train/test/valid ...
T.save({'net': m.net, 'weights': m.state_dict()}, './version1.pth')

最后，按照如下方式执行加载：

m = Model()
checkpoint = T.load('./version1.pth')
m.net = checkpoint['net']
m.load_state_dict(checkpoint['weights'])

网友

2楼 · 编辑于 2024-04-26 11:50:30

由于Pytorch在模型中提供了巨大的灵活性，因此在单个文件中保存体系结构和权重将是一个挑战。Keras模型通常仅通过堆叠Keras组件来构建，但pytorch模型由库使用者以自己的方式编排，因此可以包含任何类型的逻辑

我认为你有三个选择：

为你的实验提出一个有组织的模式，这样就不太可能丢失模型定义。您可以选择一些简单的方法，例如通过仅定义每个模型的模式命名的文件。我会推荐这种方法，因为这种级别的组织可能会从其他方面受益，并且开销最小
尝试将代码与pickle文件一起保存。虽然有可能，但我认为这会让你陷入一个有很多潜在问题的困境
使用不同的标准化方法保存模型，例如^{}。如果您不想选择选项1，我建议您选择这条路线。Onnx确实允许您保存pytorch模型的架构及其权重，但也有一些缺点。例如，它只支持某些操作，因此完全自定义的forward方法或使用非矩阵操作可能不起作用

相关问题更多 >

编程相关推荐

热门问题

热门文章

PyTorch：保存权重和模型定义

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >