在PyDev Eclipse中使用NLTK
我在用 Python 2.6 和 NLTK(一个用于处理人类语言的工具),还有一些外部资源。问题是,所有的东西都能被识别(导入语句也没问题)。
from nltk import sent_tokenize
from nltk import word_tokenize
import re
from nltk.corpus import stopwords
from nltk.stem import PorterStemmer
from nltk.probability import FreqDist
Traceback (most recent call last):
File "E:\Program Files\eclipse\Martin Project Folder\labs2\src\lab2.py", line 22, in <module>
sents.append(sent_tokenize( review.raw( ) ))
on line 22 you :
Resource 'tokenizers/punkt/english.pickle' not found. Please
use the NLTK Downloader to obtain the resource: >>>
nltk.download().
Searched in:
- 'C:\\Users\\Martinos/nltk_data'
- 'C:\\nltk_data'
- 'D:\\nltk_data'
- 'E:\\nltk_data'
- 'E:\\Python26\\nltk_data'
- 'E:\\Python26\\lib\\nltk_data'
- 'C:\\Users\\Martinos\\AppData\\Roaming\\nltk_data'
有没有人知道为什么会这样呢?因为程序应该能在 NLTK 里面找到 punkd 版本(因为它能识别 NLTK)。
2 个回答
1
你需要下载nltk的资源。要解决这个问题,可以按照以下步骤操作:
Python mode in the Terminal and run following commands
import nltk
nltk.download()
1
根据错误信息的提示,你需要在Python控制台里运行一个叫'nltk.download()'的函数,来下载你需要的资源。同时,这条信息还列出了nltk尝试寻找缺失资源的所有路径。