Pythorch二进制分类相同的网络结构，“更简单”的数据，但性能更差？

2条回答

网友

1楼 · 编辑于 2024-05-19 20:53:59

让我们先来了解一下神经网络是如何工作的，神经网络观察模式，因此需要大数据集。在这个例子中，你想要找到的两个what模式是when if HR < 91: label = 0，这个if条件可以用公式sigmoid（（HR-91）*1来表示，如果你在公式中插入不同的值，你可以看到所有值<；91，标签0和其他标签1。我已经推断出这个公式，只要它给出正确的值，它可以是任何东西。在

基本上，我们应用公式wx+b，其中x在我们的输入数据中，我们学习w和b的值。现在最初的值都是随机的，所以从1030131190（一个随机值）得到b值可能很快，因为损失很大，所以学习率允许值快速跳跃。但一旦你达到98，你的损失就在减少，当你应用学习率时，要花更多的时间才能接近91，因此损失会慢慢减少。随着数值越接近，所采取的步骤就越慢。在

这可以通过损失值来证实，它们是不断减小的，最初，减速度较高，但后来变小。你的人际网络仍在学习，但速度很慢。在

在你的学习速度下降的时代，你用这种方法来提高学习速度

网友

2楼 · 编辑于 2024-05-19 20:53:59

TL；DR

您的输入数据未规范化。在

使用x_data = (x_data - x_data.mean()) / x_data.std()
提高学习率optimizer = torch.optim.Adam(model.parameters(), lr=0.01)

您将得到

仅在1000次迭代中收敛。在

如果我不能规范化数据怎么办？

如果由于某种原因，您不能预先计算平均值和标准数据，那么您仍然可以使用^{}来估计和规范化数据，作为训练过程的一部分。例如

class Model(nn.Module):
    def __init__(self, input_size, H1, output_size):
        super().__init__()
        self.bn = nn.BatchNorm1d(input_size)  # adding batchnorm
        self.linear = nn.Linear(input_size, H1)
        self.linear2 = nn.Linear(H1, output_size)

    def forward(self, x):
        x = torch.sigmoid(self.linear(self.bn(x)))  # batchnorm the input x
        x = torch.sigmoid(self.linear2(x))
        return x

在输入数据没有任何改变的情况下，这种修改只在1000个周期后产生类似的收敛性：

小评论

为了数值稳定性，最好使用^{}而不是{a7}。为此，您需要从forward()输出中删除torch.sigmoid，而{}将在损失内计算。
例如，参见this thread关于二元预测的相关sigmoid+交叉熵损失。在

TL；DR

更多详情

如果我不能规范化数据怎么办？

小评论

相关问题更多 >

编程相关推荐

热门问题

热门文章