交叉熵为空值

ys_reshape = tf.reshape(ys,[-1,1]) prediction = tf.reshape(relu4,[-1,1]) cross_entropy = tf.reduce_mean(-(ys_reshape*tf.log(prediction))) train_step = tf.train.AdamOptimizer(0.01).minimize(cross_entropy)

1条回答

网友

1楼 · 发布于 2024-04-19 02:13:02

你把问题缩小到正确的几行代码上做得很好。

所以你预测的概率就是ReLU4的输出？

这有两个问题。

第一：可以大于一。

第二：

它可以精确地为零（只要ReLU4的输入为负，它的输出就为零）。

log(0) -> NaN

通常的方法是将线性激活（无ReLU）视为每个类的对数概率。

天真的实现总是被破坏的（数字问题）。

因为只有一个类，所以应该使用tf.sigmoid_cross_entropy_with_logits

对于训练op返回None：这里有一个微妙的区别，ops和tensor。尝试print(train_step)和print(cross_entropy)。

计算一个op可以做一些事情，而计算一个张量可以得到一个值。所以如果你在寻找前向过程中计算的交叉熵的值，就做一些类似_, loss_value = sess.run([train_step, cross_entropy])的事情

相关问题更多 >

编程相关推荐

热门问题

热门文章