拟合RandomForestClassifier时内存使用激增
我正在尝试用一个中等大小的numpy浮点数组来训练一个森林模型。
In [3]: data.shape
Out[3]: (401125, 5)
[...]
forest = forest.fit(data[:,1:],data[:,0])
问题发生在开始训练大约10秒后。它会占用最多3.6 GB(总共3.8 GB)的内存,然后我的电脑就会卡住,我不得不结束这个进程。
我查了一下,这个问题似乎很常见,尤其是当你把n_jobs
设置为大于1的值时。但我现在使用的是n_jobs
的默认值,也就是1。
我还尝试把n_estimators
从最开始的100改成5,只是想看看会不会有什么不同,但结果还是一样。
有没有人能帮我解答一下这个问题?
谢谢!
1 个回答
0
哎呀,我其实是想做回归分析,而不是分类。这个问题就关闭吧。