解释培训损失/准确度与验证损失/准确度

train = model.fit(x_train, y_train, epochs=15, batch_size=128, validation_data=(x_test,y_test), verbose=1) train = model.fit(x_train, y_train, epochs=15, batch_size=128, validation_split=0.1, verbose=1)

1条回答

网友

1楼 · 发布于 2024-04-25 19:28:46

我将尝试提供一个答案

您可以看到，在接近结束时，训练精度略高于验证精度，训练损失略低于验证损失。这暗示着过度适应，如果你训练了更多的时期，差距应该会扩大
即使使用同一个模型和同一个优化器，您也会注意到运行之间的细微差异，因为权重是随机初始化的，随机性与GPU实现相关。您可以查看here以了解如何解决此问题
不同的优化器通常会生成不同的图，因为它们更新模型参数的方式不同。例如，vanilla SGD将以恒定速率更新所有参数和所有训练步骤。但如果你增加动力，速度将取决于以前的更新，通常会导致更快的收敛。这意味着您可以在较少的迭代次数中获得与vanilla SGD相同的精度
图形将发生变化，因为如果随机拆分，训练数据将发生变化。但对于MNIST，您应该使用数据集提供的标准测试拆分

相关问题更多 >

编程相关推荐

热门问题

热门文章

解释培训损失/准确度与验证损失/准确度

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >