我正在尝试将出现在我的令牌中的每个单词输出1000次以上(>;1000),并将其保存到freq1000
freq1000 = []
newtokens = []
for words in tokens:
newtokens += words
FreqDist(newtokens)
fd_1 = FreqDist(newtokens)
for i in set(fd_1):
if fd_1.count(i) == >1000:
print(i)
这是我当前的代码,在这之后我完全被卡住了,我不确定是否有freqdist函数可以帮助我。我已成功将FreqDist保存到fd_1。我只是不确定如何获得出现1000次以上的单词的输出,并将其保存到1000
如果您能提供任何帮助,我将不胜感激
您可以使用下面的
freqDist.items()
根据频率计数过滤单词:希望有帮助:)