Python NLTK FreqDist列出频率大于1000的单词

2024-06-16 14:55:35 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试将出现在我的令牌中的每个单词输出1000次以上(>;1000),并将其保存到freq1000

freq1000 = []

newtokens = []

for words in tokens:
    newtokens += words
FreqDist(newtokens)

fd_1 = FreqDist(newtokens)

for i in set(fd_1):
    if fd_1.count(i) == >1000:
        print(i)

这是我当前的代码,在这之后我完全被卡住了,我不确定是否有freqdist函数可以帮助我。我已成功将FreqDist保存到fd_1。我只是不确定如何获得出现1000次以上的单词的输出,并将其保存到1000

如果您能提供任何帮助,我将不胜感激


Tags: 代码ingtforifcount单词words