如何修复imdb.load_data（）函数的“allow_pickle=False时无法加载对象数组”？

ValueError Traceback (most recent call last) <ipython-input-1-2ab3902db485> in <module>() 1 from keras.datasets import imdb ----> 2 (train_data, train_labels), (test_data, test_labels) = imdb.load_data(num_words=10000) 2 frames /usr/local/lib/python3.6/dist-packages/keras/datasets/imdb.py in load_data(path, num_words, skip_top, maxlen, seed, start_char, oov_char, index_from, **kwargs) 57 file_hash='599dadb1135973df5b59232a0e9a887c') 58 with np.load(path) as f: ---> 59 x_train, labels_train = f['x_train'], f['y_train'] 60 x_test, labels_test = f['x_test'], f['y_test'] 61 /usr/local/lib/python3.6/dist-packages/numpy/lib/npyio.py in __getitem__(self, key) 260 return format.read_array(bytes, 261 allow_pickle=self.allow_pickle, --> 262 pickle_kwargs=self.pickle_kwargs) 263 else: 264 return self.zip.read(key) /usr/local/lib/python3.6/dist-packages/numpy/lib/format.py in read_array(fp, allow_pickle, pickle_kwargs) 690 # The array contained Python objects. We need to unpickle the data. 691 if not allow_pickle: --> 692 raise ValueError("Object arrays cannot be loaded when " 693 "allow_pickle=False") 694 if pickle_kwargs is None: ValueError: Object arrays cannot be loaded when allow_pickle=False

3条回答

网友

1楼 · 编辑于 2024-05-16 04:29:21

这个问题仍在keras git的讨论中。我希望能尽快解决。在那之前，试着把你的numpy版本降到1.16.2。它似乎解决了这个问题。

!pip install numpy==1.16.1
import numpy as np

此版本的numpy的默认值为allow_pickle，即True。

网友

2楼 · 编辑于 2024-05-16 04:29:21

这里有一个技巧，可以强制imdb.load_data允许pickle在笔记本中替换这一行：

(train_data, train_labels), (test_data, test_labels) = imdb.load_data(num_words=10000)

据此：

import numpy as np
# save np.load
np_load_old = np.load

# modify the default parameters of np.load
np.load = lambda *a,**k: np_load_old(*a, allow_pickle=True, **k)

# call load_data with allow_pickle implicitly set to true
(train_data, train_labels), (test_data, test_labels) = imdb.load_data(num_words=10000)

# restore np.load for future normal usage
np.load = np_load_old

网友

3楼 · 编辑于 2024-05-16 04:29:21

继GitHub上的issue之后，官方解决方案是编辑imdb.py文件。这个修复对我来说很好，不需要降级numpy。在tensorflow/python/keras/datasets/imdb.py找到imdb.py文件（我的完整路径是：C:\Anaconda\Lib\site-packages\tensorflow\python\keras\datasets\imdb.py-其他安装将不同），并根据差异更改第85行：

-  with np.load(path) as f:
+  with np.load(path, allow_pickle=True) as f:

更改的原因是安全性，以防止在pickled文件中插入与SQL等价的Python。上述更改只会影响imdb数据，因此您可以在其他地方保留安全性（不降低numpy的级别）。

相关问题更多 >

编程相关推荐

热门问题

热门文章