我一直在使用Tensorflow 2.0处理二进制顺序输入和输出,我一直想知道Tensorflow使用哪种方法来计算这些场景中培训期间的回忆或准确性等指标
我的网络的每个示例由60个时间步组成,每个时间步有300个特性,因此我的预期输出是1和0的(60, 1)
数组。假设我有2000个验证样本。在评估每个历元的验证集时,tensorflow是否将2000个样本的所有连接到单个(2000*60=120000, 1)
数组中,然后与连接的地面真相标签进行比较,还是单独评估每个(60, 1)
,然后返回这些值的平均值?有没有办法改变这种行为
Tags:
默认情况下,Tensorflow/Keras会批量计算列车数据的度量,而在
fit
方法中validation_data
参数中传递的所有数据上,Tensorflow/Keras会计算相同的度量这意味着在列车数据拟合期间打印的度量值是在所有批次上计算的分数的平均值。换句话说,对于列车组,keras单独评估每个巴赫,然后返回这些值的平均值。由于验证数据不同,keras获取所有验证样本,然后将它们与“串联”的groundtruth标签进行比较
为了用代码证明这种行为,我提出了一个虚拟示例。我提供了一个定制的回调函数,用于计算在历元结束时传递的所有数据的准确度分数(用于训练和可选的验证)。这有助于我们理解张量流在训练期间的行为
创建虚拟数据
拟合模型
在下面的图表中,我比较了回调计算的精度和keras计算的精度
正如我们所看到的,默认方法和回调之间的列车数据(第一个图)的准确性是不同的。这意味着列车数据的准确性是按批次计算的。 我们回调计算的验证精度(第二个图)与默认方法相同!这意味着验证数据的分数计算一次
相关问题 更多 >
编程相关推荐