我试图将一个大的拆分列表传递给函数'FreqDist'以查找最常用的单词。在
我使用pickle将列表拆分如下:
import nltk
import cPickle as pickle
import sys
import os
import itertools as it
for no,i in enumerate(it.islice(it.count(), 3, 33+3, 3)):
if no == 0:
fil = tokens[0:i]
else:
fil = tokens[i-3+1:i+1]
file_name = "/tmp/words/text" + str(no+1) + '.p'
files = open(file_name, "wb")
pickle.dump(fil, files)
files.close()
现在我想使用类运算符传递文件,如下所示:
^{pr2}$不幸的是,用这种方法我得到了一个错误:
TypeError: iter() returned non-iterator of type 'Passer'
有人知道怎么解决这个问题吗?在
尝试:
例如:
^{pr2}$我将以下文本存储到11个pickle文件中:
这个目录名为words(path=/tmp/words),有11个填充名为testo1、testo2等。现在我找到了实现目标的正确理解:
^{pr2}$现在,似乎一切都在工作,但我在问自己,这是否会一步一步地给FreqDist提供信息,还是先加载列表,然后再处理它。因为我的想法是一步一步地加载和处理文件,而不必一次加载以节省内存。在
再次感谢你的帮助。在
相关问题 更多 >
编程相关推荐