Python单词_tokeniz

1条回答

网友

1楼 · 发布于 2024-05-19 03:04:47

您的问题是，您试图在脚本中运行nltk.download()，而GUI似乎隐藏在页面后面的某个地方。

通常，nltk.download()通常在Python解释器中运行，它允许您下载各种数据集和实体（corpii？：P）用于nltk。你通常只需要这样做一次，只有当你想更新你的小体时才需要再次使用它。您不必每次运行脚本时都运行它。

假设您已经在Python解释器中运行了nltk.download()，那么您将获得某种形式的GUI，或者如果您不能访问GUI（例如，如果您在没有X转发的情况下使用SSHd），那么它将是一个命令行界面。你可以用这个下载数据。我建议你下载所有的，除非你有足够的空间。

一旦您运行nltk.download()并下载了您认为需要的所有内容，下面的代码就应该可以工作了。

import nltk
import os

os.getcwd()
text_file=open(r"ecelebi\1.txt","r")

p = text_file.read()
words = nltk.tokenize.word_tokenize(p)

fdist= nltk.FreqDist(words)
print(fdist)

注意命令是nltk.FreqDist，而不是FreqDist，因为函数在nltk命名空间中。

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python单词_tokeniz

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >