许多语言中的停止词列表

many-stop-words的Python项目详细描述


简单的python包,它提供了一个加载集合的函数 不同语言的停止词。

用英语、法语、德语、finish、匈牙利语、土耳其语停止单词, 俄语、捷克语、希腊语、阿拉伯语、汉语、日语、韩语、加泰罗尼亚语、波兰语、希伯来语、挪威语, 瑞典语,意大利语,葡萄牙语和西班牙语,从 以下来源:

名为orig的目录包含用于 编译停止词列表。未使用名为的目录包含 用于为非特定语言创建更多停止词列表的原始数据 但也有许多“停止”字。可用语言

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java HttpSession API   如果模式可用,xml java将忽略DTD进行验证   java从远程位置调用Jersey API   在Java中直接从URL读取html   如何使用#Hibernate#Spring#Java在MySql中存储“日期”?   java如何在JSP中迭代列表对象?   java如何使用PDFBox确定实际PDF内容的位置?   utf 8计算Java字符串的UTF8长度,而不实际对其进行编码   java我正在尝试通过whatsapp或任何其他messenger应用程序发送/共享mp3原始文件。   使用Java定期将记录写入CSV文件   用于队列和工作程序设计的java实时执行器池   java与t1的区别是什么。当前线程和线程。当前线程?   java将大字符串写入文本文件?   java传递给侦听器   java如何从对象列表向JComboBox添加项