许多语言中的停止词列表
many-stop-words的Python项目详细描述
简单的python包,它提供了一个加载集合的函数 不同语言的停止词。
用英语、法语、德语、finish、匈牙利语、土耳其语停止单词, 俄语、捷克语、希腊语、阿拉伯语、汉语、日语、韩语、加泰罗尼亚语、波兰语、希伯来语、挪威语, 瑞典语,意大利语,葡萄牙语和西班牙语,从 以下来源:
- Wiktionary lists of prepositions in the respective languages
- Perseus: http://www.perseus.tufts.edu/hopper/stopwords
- Ranks.nl: http://www.ranks.nl/resources/stopwords.html
- Google: http://code.google.com/p/stop-words/
- Kevin Bouge: https://sites.google.com/site/kevinbouge/stopwords-lists
- NLTK
名为orig的目录包含用于 编译停止词列表。未使用名为的目录包含 用于为非特定语言创建更多停止词列表的原始数据 但也有许多“停止”字。可用语言