Python停止了切换到GPU contex的工作

2024-03-29 15:24:00 发布

您现在位置:Python中文网/ 问答频道 /正文

我尝试在AWS上设置我的机器学习环境,如下所示:

OS: windows server 2012 r2 , 64 bit
instance: p2.xlarge
GPU : Tesla K80 series
CUDA: 9.2.148
Graphis driver: 398.26 (installed by cuda toolkit)
python : 3.5 ( tested using 2.7.15 as well) ,64 bit
IDE: Pycharm Community 2018.2, 64 bit
mxnet librabry: mxnet-cu92

现在,当我运行以下代码时:

import mxnet as mx
from mxnet import nd
mx.random.seed(1)
z = nd.ones(shape=(3,3), ctx=mx.cpu())
print(z)

它工作得很好,但是当我改变ctx时=mx.gpu()或ctx=mx.gpu(0),我发现python停止工作时出错。你知道吗

我编译并运行了deviceQuerybandwidthTest示例应用程序,这些程序的输出与预期一致。你知道吗

EDIT::python崩溃详细信息提供了以下信息:

Fault Module Name:  ucrtbase.DLL

我尝试了Cuda Graphis驱动程序:398.44(从Cuda网站推荐用于我的gpu和操作系统)到目前为止仍然没有运气。你知道吗

有解决这个问题的办法吗?你知道吗


Tags: import机器awsgpu环境oswindowsas
1条回答
网友
1楼 · 发布于 2024-03-29 15:24:00

我花了将近3天的时间终于得到了解决方案,是mxnet库引起了这个问题。在尝试了不同的cuda工具包和mxnet库之后,以下组合对我很有用:

1) Cuda Toolkit - 9.2
   Mxnet lbrary : mxnet-cu92 version 1.2.0b20180525
   (Failing for most of the recent versions ) 
2)  Cuda Toolkit - 8.0
   Mxnet lbrary : mxnet-cu80 version 0.11.0
   (Failing for most of the recent versions  ) 

谢谢

相关问题 更多 >