根据单词的频率列出字符串
TTC的Python项目详细描述
#ttcpy-text to columns python
这是r中原始ttc包的python版本。包的目的是过滤非频繁单词的字符串,并将其转换为具有常用单词频率的列。
一。类的初始过程。给它一些参数,比如0到1之间的最小支持。记住,“minsup”越低,计算时间就越长。
````
init=ttc(data,minsup)
````
-`data`:要转换的字符串列表。
-`minsup`:如果单词的频率低于此值,则将其过滤掉。介于0和1之间的值。
-
2。稍后,您可以调用compute函数,该函数将使用给定的数据计算它。输出将是一个带有单词频率的“numpy”数组。
````
init.compute()
````
-
>3。你也可以把最常用的词叫做。这些单词的顺序与步骤2的输出相同。输出将是一个带有频繁单词的“numpy”数组。
````
init.header
````
--包ttcpy的更新---
-19/07/2018-版本0.2.0
为一些函数引入了“numba”模块。也去掉了模块“re”的依赖性。
-11/07/2018-version 0.1.0
实现了从r到python(ttcpy)的ttc版本。没有像r包中那样过滤掉特定单词的选项。
这是r中原始ttc包的python版本。包的目的是过滤非频繁单词的字符串,并将其转换为具有常用单词频率的列。
一。类的初始过程。给它一些参数,比如0到1之间的最小支持。记住,“minsup”越低,计算时间就越长。
````
init=ttc(data,minsup)
````
-`data`:要转换的字符串列表。
-`minsup`:如果单词的频率低于此值,则将其过滤掉。介于0和1之间的值。
-
2。稍后,您可以调用compute函数,该函数将使用给定的数据计算它。输出将是一个带有单词频率的“numpy”数组。
````
init.compute()
````
-
>3。你也可以把最常用的词叫做。这些单词的顺序与步骤2的输出相同。输出将是一个带有频繁单词的“numpy”数组。
````
init.header
````
--包ttcpy的更新---
-19/07/2018-版本0.2.0
为一些函数引入了“numba”模块。也去掉了模块“re”的依赖性。
-11/07/2018-version 0.1.0
实现了从r到python(ttcpy)的ttc版本。没有像r包中那样过滤掉特定单词的选项。