def target(j):
from time import sleep
from sklearn.ensemble import RandomForestClassifier
rf = RandomForestClassifier(n_jobs=2)
rf.fit(np.random.random(size=(100, 100)), np.random.random(100)> .6)
print(j, 'done')
pr = [mp.Process(target=target, args=(i,)) for i in range(10)];\
[p.start() for p in pr]
[p.join() for p in pr]
此警告来自
joblib
,它是sklearn
中使用的多处理库。 它的并行机制依赖于multiprocessing.Pool
,后者使用了不能生成子进程的daemonic
工作线程。在我不认为有任何简单的方法可以通过}。
sklearn
来绕过这个限制。 您可能需要手动创建和管理流程。 如果你知道你在做什么,你可以创建你的Process
并用它们来运行sklearn
函数和{这意味着需要非常小心地管理流程,而不是同时运行它们。 同样重要的是不要使它们
daemonic
。 例如:请注意,所有进程都是同时运行的,这可能导致比顺序实现更糟糕的性能。在
也就是说,在使用嵌套并行是一个好主意的情况下,它们的用例并不多。 所有的核心都应该用于时间消耗较多的任务,其他任务按顺序运行。在
相关问题 更多 >
编程相关推荐