如何在windows中安装NLTK数据(Anaconda)

2024-05-23 18:17:31 发布

您现在位置:Python中文网/ 问答频道 /正文

我的代码中需要一些NLTK数据包。我试着从下面的命令安装它,但是它安装了我不需要的所有包

conda install -c conda-forge nltk_data

如何安装特定的NLTK数据包,如stopwords、punkt等


Tags: install代码命令data数据包condaforgenltk
2条回答

使用pip安装nltk之后,在ipython中运行以下代码

import nltk
nltk.download()

在这之后,你将得到一个GUI,在那里你可以下载所有的数据

如果你想具体下载,你也可以这样做。图形用户界面如下所示enter image description here

NLTK documentation

Run the Python interpreter and type the commands:

import nltk
nltk.download()

将弹出一个新窗口,您可以在其中选择要安装的软件包。

或者,您可以使用

python -m nltk.downloader <collection|package|all>

要安装所需的包或集合,或使用all安装所有这些包或集合。

下面是可以在此命令中使用的包和集合的列表,从nltk_data gh-pages中提取。

包装

  • 马克森特纳克
  • abc公司
  • 阿尔皮诺
  • 生物处理
  • 棕色
  • 布朗蒂
  • 塞斯猫
  • 塞斯普
  • 聊天80
  • 城市数据库
  • 研究
  • 比较句
  • 通信传输
  • 康利2000
  • 2002年
  • 2007年
  • 克鲁巴丹
  • 依赖树银行
  • 多尔奇
  • 欧洲生的
  • 弗洛雷斯塔
  • 框架网络
  • 框架网络
  • 地名录
  • 创世记
  • 古腾堡
  • 伊尔
  • 就职典礼
  • 印第安人
  • 杰塔
  • 金莫
  • knbc公司
  • 林语录
  • 麦莫
  • 马查多
  • masc U标记
  • 影评
  • 地铁5
  • 姓名
  • nombank.1.0版
  • 不间断前缀
  • nps_聊天
  • omw公司
  • 意见词典
  • 潘莱克斯·斯瓦德什
  • 范式
  • pe08系列
  • 皮尔
  • pl196x系列
  • 帕塔奇
  • 问题报告
  • 产品评论
  • 产品评论
  • 支撑银行
  • 利弊
  • ptb公司
  • 质量控制
  • 路透社
  • rte公司
  • 森科尔
  • 感官评估
  • 句子极性
  • 哨兵网
  • 莎士比亚
  • 中国树银行
  • 蓝精灵
  • 州工会
  • 停止语
  • 主观性
  • 斯瓦德什
  • 交换机
  • 胆小的
  • 工具箱
  • 树银行
  • twitter示例
  • 世界人权组织
  • udhr2型
  • unicode示例
  • 通用树银行
  • 详细网络
  • 网络文本
  • 文字网
  • wordnet集成电路
  • 文字
  • ycoe公司
  • 巴斯克语语法
  • 图书语法
  • 大语法
  • 示例语法
  • 西班牙语语法
  • 标记集
  • 兆瓦ppdb
  • 肺泡虫
  • 布利浦华尔街日报
  • 摩西样本
  • wmt15评估
  • word2vec_示例
  • 维达词典
  • 波特测验
  • rslp公司
  • 雪球数据
  • 平均感知器
  • 平均感知器
  • maxent_treebank_pos_标签
  • 通用标记集
  • 朋克

集合及其包含的包

  • 全体下士
    • abc公司
    • 阿尔皮诺
    • 生物处理
    • 棕色
    • 布朗蒂
    • 塞斯猫
    • 塞斯普
    • 聊天80
    • 城市数据库
    • 研究
    • 通信传输
    • 康利2000
    • 2002年
    • 2007年
    • 克鲁巴丹
    • 依赖树银行
    • 多尔奇
    • 弗洛雷斯塔
    • 框架网络
    • 框架网络
    • 地名录
    • 创世记
    • 古腾堡
    • 伊尔
    • 就职典礼
    • 印第安人
    • 杰塔
    • 金莫
    • knbc公司
    • 林语库
    • 麦莫
    • 马查多
    • masc U标记
    • 影评
    • 姓名
    • nombank.1.0版
    • nps_聊天
    • omw公司
    • 范式
    • 皮尔
    • pl196x系列
    • 帕塔奇
    • 问题报告
    • 支撑银行
    • ptb公司
    • 质量控制
    • 路透社
    • rte公司
    • 森科尔
    • 感官评估
    • 哨兵网
    • 莎士比亚
    • 中国树银行
    • 州工会
    • 停止语
    • 斯瓦德什
    • 交换机
    • 胆小的
    • 工具箱
    • 树银行
    • 世界人权组织
    • udhr2型
    • unicode示例
    • 通用treebanks v20
    • 详细网络
    • 网络文本
    • 文字网
    • wordnet集成电路
    • 文字
    • ycoe公司
    • 潘莱克斯·斯瓦德什
    • 地铁5
    • 不间断前缀
  • 所有nltk
    • abc公司
    • 阿尔皮诺
    • 生物处理
    • 棕色
    • 布朗蒂
    • 塞斯猫
    • 塞斯普
    • 聊天80
    • 城市数据库
    • 研究
    • 比较句
    • 通信传输
    • 康利2000
    • 2002年
    • 2007年
    • 克鲁巴丹
    • 依赖树银行
    • 欧洲生的
    • 弗洛雷斯塔
    • 框架网络
    • 框架网络
    • 地名录
    • 创世记
    • 古腾堡
    • 伊尔
    • 就职典礼
    • 印第安人
    • 杰塔
    • 金莫
    • knbc公司
    • 林语录
    • 麦莫
    • 马查多
    • masc U标记
    • 摩西样本
    • 影评
    • 姓名
    • nombank.1.0版
    • nps_聊天
    • omw公司
    • 意见词典
    • 范式
    • 皮尔
    • pl196x系列
    • 帕塔奇
    • 问题报告
    • 支撑银行
    • ptb公司
    • 产品评论
    • 产品评论
    • 利弊
    • 质量控制
    • 路透社
    • rte公司
    • 森科尔
    • 感官评估
    • 哨兵网
    • 句子极性
    • 莎士比亚
    • 中国树银行
    • 蓝精灵
    • 州工会
    • 停止语
    • 主观性
    • 斯瓦德什
    • 交换机
    • 胆小的
    • 工具箱
    • 树银行
    • twitter示例
    • 世界人权组织
    • udhr2型
    • unicode示例
    • 通用树银行
    • 详细网络
    • 网络文本
    • 文字网
    • wordnet集成电路
    • 文字
    • ycoe公司
    • rslp公司
    • maxent_treebank_pos_标签
    • 通用标记集
    • 马克森特纳克
    • 朋克
    • 图书语法
    • 示例语法
    • 西班牙语语法
    • 巴斯克语语法
    • 大语法
    • 标记集
    • 雪球数据
    • 布利浦华尔街日报
    • word2vec_示例
    • 潘莱克斯·斯瓦德什
    • 地铁5
    • 平均感知器
    • 肺泡虫
    • 不间断前缀
    • 维达词典
    • 波特测验
    • wmt15评估
    • 兆瓦ppdb
  • 全部
    • abc公司
    • 阿尔皮诺
    • 生物处理
    • 棕色
    • 布朗蒂
    • 塞斯猫
    • 塞斯普
    • 聊天80
    • 城市数据库
    • 研究
    • 比较句
    • 通信传输
    • 康利2000
    • 2002年
    • 2007年
    • 克鲁巴丹
    • 依赖树银行
    • 多尔奇
    • 欧洲生的
    • 弗洛雷斯塔
    • 框架网络
    • 框架网络
    • 地名录
    • 创世记
    • 古腾堡
    • 伊尔
    • 就职典礼
    • 印第安人
    • 杰塔
    • 金莫
    • knbc公司
    • 林语录
    • 麦莫
    • 马查多
    • masc U标记
    • 摩西样本
    • 影评
    • 姓名
    • nombank.1.0版
    • nps_聊天
    • omw公司
    • 意见词典
    • 范式
    • 皮尔
    • pl196x系列
    • 帕塔奇
    • 问题报告
    • 支撑银行
    • ptb公司
    • 产品评论
    • 产品评论
    • 利弊
    • 质量控制
    • 路透社
    • rte公司
    • 森科尔
    • 感官评估
    • 哨兵网
    • 句子极性
    • 莎士比亚
    • 中国树银行
    • 蓝精灵
    • 州工会
    • 停止语
    • 主观性
    • 斯瓦德什
    • 交换机
    • 胆小的
    • 工具箱
    • 树银行
    • twitter示例
    • 世界人权组织
    • udhr2型
    • unicode示例
    • 通用树银行
    • 详细网络
    • 网络文本
    • 文字网
    • 世界数字网络
    • 文字
    • ycoe公司
    • rslp公司
    • maxent_treebank_pos_标签
    • 通用标记集
    • 马克森特纳克
    • 朋克
    • 图书语法
    • 示例语法
    • 西班牙语语法
    • 巴斯克语语法
    • 大语法
    • 标记集
    • 雪球数据
    • 布利浦华尔街日报
    • word2vec_示例
    • 潘莱克斯·斯瓦德什
    • 地铁5
    • 平均感知器
    • 肺泡虫
    • 不间断前缀
    • 维达词典
    • 波特测验
    • wmt15评估
    • 兆瓦ppdb
    • abc公司
    • 棕色
    • 聊天80
    • 研究
    • 康利2000
    • 2002年
    • 依赖树银行
    • 创世记
    • 古腾堡
    • 伊尔
    • 就职典礼
    • 影评
    • nps_聊天
    • 姓名
    • 帕塔奇
    • 路透社
    • 感官评估
    • 州工会
    • 停止语
    • 斯瓦德什
    • 胆小的
    • 树银行
    • 工具箱
    • 世界人权组织
    • udhr2型
    • unicode示例
    • 网络文本
    • 文字网
    • wordnet集成电路
    • 文字
    • maxent_treebank_pos_标签
    • 马克森特纳克
    • 通用标记集
    • 朋克
    • 图书语法
    • 城市数据库
    • 标记集
    • 潘莱克斯·斯瓦德什
    • 平均感知器
  • 流行的
    • 研究
    • 地名录
    • 创世记
    • 古腾堡
    • 就职典礼
    • 影评
    • 姓名
    • 莎士比亚
    • 停止语
    • 树银行
    • twitter示例
    • omw公司
    • 文字网
    • wordnet集成电路
    • 文字
    • 马克森特纳克
    • 朋克
    • 雪球数据
    • 平均感知器
  • 测试
    • 平均感知器
    • 波特测验
    • twitter示例
    • wmt15评估
    • 主观性
    • 框架网络
    • 产品评论
    • 产品评论
    • 维达词典
    • 克鲁巴丹
    • 地铁5
    • 句子极性
    • 通用树银行
    • 潘莱克斯·斯瓦德什
    • 不间断前缀
    • 肺泡虫
    • 利弊
    • 意见词典
    • 比较句
  • 第三方
    • 多尔奇

相关问题 更多 >