Tensorflow模型训练。ipynb有效,.py崩溃

2024-06-16 08:48:16 发布

您现在位置:Python中文网/ 问答频道 /正文

我需要训练一个用TensorFlow实现的神经网络模型(4个GRU层)。我从另一个开发人员那里得到的代码最初是一个Jupyter笔记本

如果我运行笔记本电脑的话,这个型号训练得很好,RAM的使用率约为20%,GPU的使用率约为11GB

如果我将代码复制到python文件中并运行它,它会不断崩溃。如果我减少批量大小,也会发生这种情况。特别是,RAM使用率更高,GPU内存使用率更低(约2.5 GB)

我收到的错误消息如下:

2401/2402 [============================>.] - ETA: 0s - loss: 0.0866 - accuracy: 0.9831 - precision: 0.0000e+00 - recall: 0.0000e+002021-08-12 08:29:31.894194: W tensorflow/core/framework/cpu_allocator_impl.cc:80] Allocation of 2053413600 exceeds 10% of free system memory.
[...]
Filling up shuffle buffer (this may take a while): 15082 of 19299
Killed

你对如何解决这个问题有什么建议吗?我更喜欢使用python文件训练模型(每个历元的时间要小得多)


Tags: 文件of代码模型gpu开发人员tensorflow笔记本