按拼音和笔顺快速排序大量简体中文词组(支持百万数量级)。

cn-sort的Python项目详细描述


cn_sort

按拼音和笔顺精确、快速排序大量简体中文词组(支持百万数量级,简体中文与非中文混用的词组也可),有效解决多音字混排的问题。

依赖

运行python版本:

  • 3.6+

本项目涉及以下依赖:

  • jieba
  • pypinyin

安装

pip安装命令:

pip install cn_sort --upgrade

使用

from cn_sort.process_cn_word import *

text_list = ["重心", "河水", "重庆", "河流", "WTO世贸组织"]      # 待排序的中文词组列表
result_text_list=list(sort_text_list(text_list))        # 按拼音和笔顺排序后的中文字组列表
print(result_text_list)

# 输出为:
# ['WTO世贸组织', '重庆', '河流', '河水', '重心']

具体使用见函数注释。

构思

待补充。

来源

待补充。

缺陷

待补充。

表结构

待补充。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java在Hibernate中从两个具有不同功能的表(postgreSQL)映射一个实体   java jfreechart需要自定义Y轴,以便打印   Java:从外部获取类。罐子   java如何获取Appium服务器日志   具有完全相同内容的java重写函数会导致错误   java消息的类路径是什么。属性(如果在依赖项jar中)   循环/相等的java问题==   java如何使用ionic cordova angularjs将所选图像发送到spring controller以保存到服务器?   库中的java语言环境数据   java从JSON webservice检索安卓中的字节[]   调试如何从Java中的类调试方法?   java将日期字符串切割成变量   无法使用java附加到文件?