对文本文件中的字母、字母对和单词进行计数。也包括天成文书和孟加拉语结合

textfreq的Python项目详细描述


===
文本频率
=


描述:
----
一个脚本,用于计算文本中以下内容的频率:
单词
字母
字母对
梵文结合
孟加拉文结合

可以很好地处理非ascii文件1GB的数据需要大约5-7分钟。“安装”,在“命令/命令”提示符下,输入/输出;命令行:“W”;(p);p(对),p(对),L(字母),DC(Deva Conjuncts),- BC(0);``

版本历史:
----
**v0.100***
-显著提高速度
-添加天成文书和孟加拉文联合查找器

**v0.001***
-添加单词、对和字母计数

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java JBPM:无法部署进程存档:null   java将一个数组拆分为两个大小相等的数组   java Spring boot验证该字段是否为string类型   JAVA JPA保存到TSV而不是SQL   java PMD报告超过X个违规   java是否支持springdatagremlin中的自定义查询?   java在“for”循环后使用变量   JPQL中默认查询中的java错误列   如何在java中实现不同于线程的进程?   java如何检查字符串是否平衡?   xml使用xalan扩展在XSL中处理java集合   java我试图使用子类/超类重写另一个类的值   转换为JSON时出现java堆栈溢出问题   java考虑定义一个类型为“COM”的bean。实例演示。在您的配置中命令$DefaultIO   java在kubernetes中如何检索转发端口的值?   JavaEclipse,动态web项目,向类路径添加另一个eclipse项目   eclipse的java Spring上下文XML验证器?   Linux下利用MATLAB(Windows)生成Java包   Java:在存储到DDC之前验证属性   java校验字符串