张量流：难以置信的巨大的稀疏范畴交叉熵

1条回答

网友

1楼 · 发布于 2024-04-24 15:31:46

这正是您需要将模型中的数字特征标准化的原因。这在几乎所有具有不同取值范围的特征的ann中都是必要的。在第一步之后，权重可以做一个巨大的跳跃来尝试对这些大规模特征进行建模，你的损失将恢复正常，但在开始时权重是随机的，可能集中在零附近，这取决于你如何初始化它们。如果你在一开始就考虑这些小特征权重的输出预测，然后看到这些非标准化特征值的差异将达到数百万个数量级，这就是损失值爆炸的原因。在

教训是，如果不首先将这些特征标准化（减去平均值并除以标准差），就不应该将这些特征放入网络中。试着这样做，你会发现行为会恢复正常。在

编程相关推荐

jar文件中的java图像
jsf如何使用java从资源文件中读取属性
java如何使用BasicDBObject中的数据检索ArrayList中的数据？
java重叠正则表达式第二部分
java 1.6中未给出阶乘递归异常
转换器Java将十进制转换为任意二进制位
java模拟记录器。使用jmock的getLogger（）
java将字符串拆分为几个不同的字符串
java清除二维数组中的所有元素
java Libgdx更改单元格大小，而不必重新调整表的大小

相关问题更多 >

编程相关推荐

热门问题

热门文章

张量流：难以置信的巨大的稀疏范畴交叉熵

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >