pickle.dump遭遇RuntimeError：最大递归深度超出

4 投票

1 回答

2124 浏览

提问于 2025-04-17 23:46

我注意到这个问题可能是由于beautifulsoup库或者递归数据结构引起的。不过，导致错误的数据结构看起来没有问题：

class Movie:
def __init__(self, name="", dscore=0, mscore=0, durl="", murl=""): 
    self.name = name
    self.dscore = float(dscore)
    self.mscore = float(mscore)
    self.durl = durl
    self.murl = murl
def __str__(self):
    return unicode(self.name) + u' / ' + unicode(self.dscore) + u' / ' + unicode(self.mscore) \
        + u' / ' + unicode(self.durl) + u' / ' + unicode(self.murl)

引起问题的语句是：

DataDict['MovieInfo'] = MovieInfo

还有

pickle.dump(DataDict, f, True)

下面是这个函数：

def SaveData():
global LinkUrlQueue
global MovieSet
global MovieInfo
global LinkUrlSet
global MovieUrlQueue
DataDict = {}
DataDict['LinkUrlSet'] = LinkUrlSet
DataDict['MovieSet'] = MovieSet
#DataDict['MovieInfo'] = MovieInfo
DataDict['LinkUrlQueue'] = LinkUrlQueue
DataDict['MovieUrlQueue'] = MovieUrlQueue
f = open('MovieInfo.txt', 'wb')

for item in MovieInfo:
    f.write(item.__str__().encode('utf8') + '\n'.encode('utf8'))
f.close()
try:
    print 'saving data...'
    f = open('spider.dat', 'wb')
    pickle.dump(DataDict, f, True)
    f.close()
except IOError as e:
    print 'IOError, error no: %d' % e.no
    print 'saved to spider2.dat'
    pickle.dump(DataDict, open('spider2.dat', 'wb'))
    time.sleep(10)

我的完整源代码：

spider.py: http://paste.ubuntu.com/7149731/

fetch.py: http://paste.ubuntu.com/7149732/

你可以直接下载并运行。

另外，欢迎任何编码风格的建议。

错误处理数据结构数据序列化编码风格 beautifulsoup 递归深度爬虫 runtimeerror

1 个回答

好吧…我终于自己解决了这个问题…

这个问题的原因是，pickle 不能处理 BEAUTIFULSOUP！一般来说，它无法处理 HTML 解析器。

我意识到在把参数传递给我的函数时，应该先把它们转换成 str() 或 unicode()，然后再进行赋值，而不是直接把它们当作 beautifulsoup 对象。

谢谢大家~

回答于 2025-04-17 由 Python大师

分享举报

pickle.dump遭遇RuntimeError：最大递归深度超出

1 个回答

撰写回答