根据单词的频率列出字符串

TTC的Python项目详细描述


#ttcpy-text to columns python

这是r中原始ttc包的python版本。包的目的是过滤非频繁单词的字符串,并将其转换为具有常用单词频率的列。


一。类的初始过程。给它一些参数,比如0到1之间的最小支持。记住,“minsup”越低,计算时间就越长。

````
init=ttc(data,minsup)
````

-`data`:要转换的字符串列表。
-`minsup`:如果单词的频率低于此值,则将其过滤掉。介于0和1之间的值。

-


2。稍后,您可以调用compute函数,该函数将使用给定的数据计算它。输出将是一个带有单词频率的“numpy”数组。

````
init.compute()
````
-

>3。你也可以把最常用的词叫做。这些单词的顺序与步骤2的输出相同。输出将是一个带有频繁单词的“numpy”数组。

````
init.header
````









--包ttcpy的更新---


-19/07/2018-版本0.2.0
为一些函数引入了“numba”模块。也去掉了模块“re”的依赖性。

-11/07/2018-version 0.1.0
实现了从r到python(ttcpy)的ttc版本。没有像r包中那样过滤掉特定单词的选项。




欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
当您有许多具有不同密钥值的位置时,java Enterprise是加密环境变量的正确方法   java如何使用视图保持器模式制作自定义适配器?   java如何迭代Camel体中的嵌套列表?   序列化用base 64进行Java序列化   java打开文件的最佳方式(并确保选择了文件)   java marvin图像色差插件错误   java如何在eclipse中添加属性文件文件夹   比较java。util。日历日期到java。util。日期   java无法在下一个类(活动)中获取哈希表   java如何将这段代码转换为循环?   java查找通过REST失败   java getIntent返回null   在Java中,如何通过外部集合从内部集合检索数据?   java单点登录以保护REST API和内部基于web的系统