如何消除训练数据分布对后续神经网络分类函数的巨大负面影响?

2024-04-20 04:19:09 发布

您现在位置:Python中文网/ 问答频道 /正文

我需要在一个正态分布的数据上训练我的网络,我注意到我的神经网络有一个非常高的趋势,即只预测我导出的csv文件中出现最多的类标签(将其预测值与实际标签进行比较)。你知道吗

有什么建议(除了清理数据以产生均匀分布的训练数据)可以帮助我的神经网络不去预测最常出现的标签?

更新:我只想提一下,评论部分的建议确实有效。一、 然而,我发现在我的NN中添加一个额外的层,缓解了这个问题。你知道吗


Tags: 文件csv数据网络评论神经网络nn标签
1条回答
网友
1楼 · 发布于 2024-04-20 04:19:09

假设使用小批量训练神经网络,则可以通过确保每个小批量均匀分布来模拟(而不是生成)均匀分布的训练数据。你知道吗

例如,假设一个3类分类问题和一个minibatch size=30,通过随机选择每个类10个样本来构造每个minibatch(如果需要,可以重复)。你知道吗

相关问题 更多 >