根据单词的频率列出字符串

TTC的Python项目详细描述


#ttcpy-text to columns python

这是r中原始ttc包的python版本。包的目的是过滤非频繁单词的字符串,并将其转换为具有常用单词频率的列。


一。类的初始过程。给它一些参数,比如0到1之间的最小支持。记住,“minsup”越低,计算时间就越长。

````
init=ttc(data,minsup)
````

-`data`:要转换的字符串列表。
-`minsup`:如果单词的频率低于此值,则将其过滤掉。介于0和1之间的值。

-


2。稍后,您可以调用compute函数,该函数将使用给定的数据计算它。输出将是一个带有单词频率的“numpy”数组。

````
init.compute()
````
-

>3。你也可以把最常用的词叫做。这些单词的顺序与步骤2的输出相同。输出将是一个带有频繁单词的“numpy”数组。

````
init.header
````









--包ttcpy的更新---


-19/07/2018-版本0.2.0
为一些函数引入了“numba”模块。也去掉了模块“re”的依赖性。

-11/07/2018-version 0.1.0
实现了从r到python(ttcpy)的ttc版本。没有像r包中那样过滤掉特定单词的选项。




欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何在jprogressbar上添加文本?   java生成30到32位之间的随机数   我想从我自己的服务器而不是java worldwind中的nasa服务器获取数据   jsp中带有外部java文件的html计数器   java如何找到运行Servlet的主机和端口   我怎么能看到数学。java中的cos方法计算平方根?   java这个docker run命令做什么?   java如何在将表单提交到servlet后将原始JSP保存在URL中?   如何在Java中访问Arraylist中的字典数据?   java JPA如果我有一个实体被用作复合键,那么级联是否也构成复合键的一部分?   连接Java:文件读取/添加到文件程序时未按预期工作(逻辑错误)   java从Android向PLC发送布尔值   java Get build。gradle文件作为一个。类文件   Youtube API V3 Java无需调用浏览器即可上传视频   java如何在Unittest中测试StackOverflower错误   实现方法中的java异常处理   java这个::instanceMethod在java8中用作方法参数有什么用途   java偶尔会获得javax。邮政使用javamail阅读gmail电子邮件时的FolderClosedException