拟合RandomForestClassifier时内存使用激增

2 投票
1 回答
576 浏览
提问于 2025-04-17 14:16

我正在尝试用一个中等大小的numpy浮点数组来训练一个森林模型。

In [3]: data.shape
Out[3]: (401125, 5)

[...]
forest = forest.fit(data[:,1:],data[:,0])

问题发生在开始训练大约10秒后。它会占用最多3.6 GB(总共3.8 GB)的内存,然后我的电脑就会卡住,我不得不结束这个进程。

我查了一下,这个问题似乎很常见,尤其是当你把n_jobs设置为大于1的值时。但我现在使用的是n_jobs的默认值,也就是1。

我还尝试把n_estimators从最开始的100改成5,只是想看看会不会有什么不同,但结果还是一样。

有没有人能帮我解答一下这个问题?

谢谢!

1 个回答

0

哎呀,我其实是想做回归分析,而不是分类。这个问题就关闭吧。

撰写回答