python文本挖掘实用程序

textmining的Python项目详细描述


这个包包含各种有用的python文本挖掘函数。 它专注于统计文本挖掘(即单词袋模型),并使之 很容易从文档集合创建术语文档矩阵。这个 然后可以将矩阵读入一个统计包(R、Matlab等),以便进一步 分析。该包还提供了一些有用的实用工具来查找 搭配(即有意义的两个词短语),计算编辑距离 字里行间,把长文档分成小块。

这个包有大量的被管理的数据(stopwords,common names,and 有词性和词频的英语词典),允许 用户从文档中提取相当复杂的功能。

此包没有任何自然语言处理功能,如 词性标注的一部分。请参见python nltk中的 功能性(还有更多)。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java变量始终存储0值。为什么?   如何使用Java/REST将Azure blob从一个存储容器移动到另一个存储容器?   java将commons DBCP从1.2升级到1.4,我应该害怕吗?   java如何使用分隔符拆分字符串?   java使用数组读取json对象   java在groovy中切片字符串   交换数组java的两个邻域元素   java移动用于确定字符串是否为回文的逻辑   java Android应用程序在一个活动中崩溃   java Sparkjava将webapp文件夹设置为静态资源/模板的文件夹   java复杂条件表达式,用户易用。   java如何仅在表存在时从表中选择值   java I无法将数据从Recyclerview传递到其他活动   java数据结构最佳设计(大数据)   java Android从DatePickerDialogFragment中删除日历视图   java将数据从Firebase获取到片段   数组。sort()在java中运行不正常