在PyDev Eclipse中使用NLTK

0 投票
2 回答
4809 浏览
提问于 2025-04-16 11:01

我在用 Python 2.6 和 NLTK(一个用于处理人类语言的工具),还有一些外部资源。问题是,所有的东西都能被识别(导入语句也没问题)。

from nltk import sent_tokenize
from nltk import word_tokenize 
import re 
from nltk.corpus import stopwords 
from nltk.stem import PorterStemmer 
from nltk.probability import FreqDist

Traceback (most recent call last):
  File "E:\Program Files\eclipse\Martin Project Folder\labs2\src\lab2.py", line 22, in <module>
    sents.append(sent_tokenize( review.raw( ) ))

on line 22 you :

Resource 'tokenizers/punkt/english.pickle' not found.  Please
  use the NLTK Downloader to obtain the resource: >>>
  nltk.download().
  Searched in:
    - 'C:\\Users\\Martinos/nltk_data'
    - 'C:\\nltk_data'
    - 'D:\\nltk_data'
    - 'E:\\nltk_data'
    - 'E:\\Python26\\nltk_data'
    - 'E:\\Python26\\lib\\nltk_data'
    - 'C:\\Users\\Martinos\\AppData\\Roaming\\nltk_data'

有没有人知道为什么会这样呢?因为程序应该能在 NLTK 里面找到 punkd 版本(因为它能识别 NLTK)。

2 个回答

1

你需要下载nltk的资源。要解决这个问题,可以按照以下步骤操作:

Python mode in the Terminal and run following commands 
import nltk 
nltk.download()
1

根据错误信息的提示,你需要在Python控制台里运行一个叫'nltk.download()'的函数,来下载你需要的资源。同时,这条信息还列出了nltk尝试寻找缺失资源的所有路径。

撰写回答