NLTK语料库Twitter样本的持续导入错误

2024-04-20 01:30:24 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用这个脚本尝试从python的nltk包导入twitter\u示例。我目前正在Python环境中使用Python2.7。 我用Spyder运行代码。在

import nltk
nltk.download('twitter_samples')
from nltk.corpus import twitter_samples
print twitter_samples.fileid()

当我运行它时,我得到的是一个回报:

^{pr2}$

但当我导入影评时,效果很好。在

from nltk.corpus import movie_reviews

我真的没有任何线索来解释为什么这不起作用。我在系统中为NLTK_数据添加了一个环境变量,如建议的C:\NLTK_DATA,但这并没有修复它。它位于默认位置(C:\nltk_data)。在

也许有一种方法可以不使用import直接“导入”语料库。。。数据就在我的C盘上,我可以看到,只是不能通过导入功能访问它。在

我正试图利用这些数据来训练一个分类器来识别正面/负面的语句/tweets。在


Tags: 数据代码fromimport脚本示例环境download
1条回答
网友
1楼 · 发布于 2024-04-20 01:30:24

根据NLTK的twitter HOWTO,命令from nltk.corpus import twitter_samples是正确的,因此导入错误最可能的原因是您的NLTK版本已过期。在

nltk的twitter包是相当新的;它是在2015年9月添加的版本3.0.5,但从那时起,它以各种方式“改进”。现在nltk的版本是3.2,但是当前的Anaconda发行版附带了nltk3.1。您有哪一个?您可以通过打印出nltk.__version__来检查nltk版本。在

要更新到Anaconda发布的最新版本,请启动Anaconda命令提示符并运行以下命令:

% conda update nltk

Anaconda在发布后的几天内更新到了nltk的当前版本,所以我希望他们在以后的版本中继续这样做,除非出现一些兼容性问题。在

相关问题 更多 >