我使用这个脚本尝试从python的nltk
包导入twitter\u示例。我目前正在Python环境中使用Python2.7。
我用Spyder运行代码。在
import nltk
nltk.download('twitter_samples')
from nltk.corpus import twitter_samples
print twitter_samples.fileid()
当我运行它时,我得到的是一个回报:
^{pr2}$但当我导入影评时,效果很好。在
from nltk.corpus import movie_reviews
我真的没有任何线索来解释为什么这不起作用。我在系统中为NLTK_数据添加了一个环境变量,如建议的C:\NLTK_DATA,但这并没有修复它。它位于默认位置(C:\nltk_data)。在
也许有一种方法可以不使用import直接“导入”语料库。。。数据就在我的C盘上,我可以看到,只是不能通过导入功能访问它。在
我正试图利用这些数据来训练一个分类器来识别正面/负面的语句/tweets。在
根据NLTK的twitter HOWTO,命令
from nltk.corpus import twitter_samples
是正确的,因此导入错误最可能的原因是您的NLTK版本已过期。在nltk的twitter包是相当新的;它是在2015年9月添加的版本3.0.5,但从那时起,它以各种方式“改进”。现在nltk的版本是3.2,
但是当前的Anaconda发行版附带了nltk3.1。您有哪一个?您可以通过打印出nltk.__version__
来检查nltk版本。在要更新到Anaconda发布的最新版本,请启动Anaconda命令提示符并运行以下命令:
Anaconda在发布后的几天内更新到了nltk的当前版本,所以我希望他们在以后的版本中继续这样做,除非出现一些兼容性问题。在
相关问题 更多 >
编程相关推荐