我需要训练一个用TensorFlow实现的神经网络模型(4个GRU层)。我从另一个开发人员那里得到的代码最初是一个Jupyter笔记本
如果我运行笔记本电脑的话,这个型号训练得很好,RAM的使用率约为20%,GPU的使用率约为11GB
如果我将代码复制到python文件中并运行它,它会不断崩溃。如果我减少批量大小,也会发生这种情况。特别是,RAM使用率更高,GPU内存使用率更低(约2.5 GB)
我收到的错误消息如下:
2401/2402 [============================>.] - ETA: 0s - loss: 0.0866 - accuracy: 0.9831 - precision: 0.0000e+00 - recall: 0.0000e+002021-08-12 08:29:31.894194: W tensorflow/core/framework/cpu_allocator_impl.cc:80] Allocation of 2053413600 exceeds 10% of free system memory.
[...]
Filling up shuffle buffer (this may take a while): 15082 of 19299
Killed
你对如何解决这个问题有什么建议吗?我更喜欢使用python文件训练模型(每个历元的时间要小得多)
目前没有回答
相关问题 更多 >
编程相关推荐