我对python很陌生。我试图找到我的文本的频率分布。这是密码
import nltk
nltk.download()
import os
os.getcwd()
text_file=open(r"ecelebi\1.txt","r")
p = text_file.read()
words = nltk.tokenize.word_tokenize(p)
fdist= FreqDist(words)
print(fdist)
问题是程序没有给出任何错误或解决方案。只是把这个还给你
>>> ================================ RESTART ================================
>>>
showing info http://nltk.github.com/nltk_data/
我认为问题出在word_tokenize()上。 如果你能帮忙,我将不胜感激。 谢谢您。
您的问题是,您试图在脚本中运行
nltk.download()
,而GUI似乎隐藏在页面后面的某个地方。通常,
nltk.download()
通常在Python解释器中运行,它允许您下载各种数据集和实体(corpii?:P)用于nltk。你通常只需要这样做一次,只有当你想更新你的小体时才需要再次使用它。您不必每次运行脚本时都运行它。假设您已经在Python解释器中运行了
nltk.download()
,那么您将获得某种形式的GUI,或者如果您不能访问GUI(例如,如果您在没有X转发的情况下使用SSHd),那么它将是一个命令行界面。你可以用这个下载数据。我建议你下载所有的,除非你有足够的空间。一旦您运行
nltk.download()
并下载了您认为需要的所有内容,下面的代码就应该可以工作了。注意命令是
nltk.FreqDist
,而不是FreqDist
,因为函数在nltk
命名空间中。相关问题 更多 >
编程相关推荐