在添加数据集后重新训练pybrain神经网络

3 投票
1 回答
988 浏览
提问于 2025-04-17 08:44

我现在有一个用pybrain做的神经网络,它运行得挺不错的。理想情况下,我希望在每次添加新的数据点(比如说前几周的数据)后,能够训练这个网络并得到一个预测结果。

目前我每次都在重建这个网络,但随着每个新例子的加入,训练网络所需的时间越来越长(每增加一个例子大约要多花2分钟,而我的数据集有上千个例子)。

有没有办法通过将新的例子添加到已经训练好的神经网络中来加快这个过程,或者我是不是想得太复杂了,其实可以只用一组固定的例子(比如去年的数据)进行训练,然后再用所有新的例子(比如今年的数据)来测试呢?

1 个回答

1

这要看你的目标是什么。如果你需要一个更新的神经网络模型,你可以进行在线训练,也就是说,利用在时间$t$获取的样本,从时间$t-1$的网络开始,进行一次反向传播的步骤。或者,你也可以选择丢弃旧的样本,这样就能保持一个固定数量的训练样本,或者你可以通过某种聚类的方法来减少训练集的大小(也就是把相似的样本合并成一个)。

如果你能更详细地说明你的应用场景,那我就能更简单地给出建议了。

撰写回答