在两个GPU上使Pycuda与Mpi4py协同工作
我正在尝试在两个GPU上运行一个pycuda程序。我看到Talonmies写了一篇很棒的文章,讲解了如何使用线程库来实现这个功能,文章中还提到可以用mpi4py来做。
但是,当我用mpi4py和pycuda一起运行时,程序报错了: self.ctx = driver.Device(gpuid).max_context pycuda._driver.logicError: cuDeviceGet失败:未初始化
这可能是因为我试图同时初始化两个GPU设备。有没有人能给我一个非常简单的例子,教我如何让两个GPU在mpi4py下工作?