zhon提供中文文本处理中使用的常量。

zhon的Python项目详细描述


https://badge.fury.io/py/zhon.pnghttps://travis-ci.org/tsroten/zhon.png?branch=develop

zhon是一个python库,提供中文文本中常用的常量 处理。

关于

zhon常数可用于中文文本处理,例如:

  • 在字符串中查找cjk字符:

    >>>re.findall('[%s]'%zhon.hanzi.characters,'I broke a plate: 我打破了一个盘子.')['我','打','破','了','一','个','盘','子']
  • 验证拼音音节、单词或句子:

    >>>re.findall(zhon.pinyin.syllable,'Yuànzi lǐ tíngzhe yí liàng chē.',re.I)['Yuàn','zi','lǐ','tíng','zhe','yí','liàng','chē']>>>re.findall(zhon.pinyin.word,'Yuànzi lǐ tíngzhe yí liàng chē.',re.I)['Yuànzi','lǐ','tíngzhe','yí','liàng','chē']>>>re.findall(zhon.pinyin.sentence,'Yuànzi lǐ tíngzhe yí liàng chē.',re.I)['Yuànzi lǐ tíngzhe yí liàng chē.']

功能

  • 包括常用常数:
    • 中日韩字符和部首
    • 中文标点符号
    • 汉语句子正则表达式模式
    • 拼音元音、辅音、小写、大写和标点符号
    • 拼音音节、单词和句子的正则表达式模式
    • 注音字符和标记
    • 注音音节正则表达式模式
    • CC-CEDICT字符
  • 在Python2.7和3上运行

开始

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
GridLayout不工作的java问题   java Restlet请求对象不包含身份验证信息   java使用Cucumber为每个正在运行的线程创建一个TestNG runner类   java在平面文件中存储并跟踪它们?   类Lcom/google/firebase/FirebaseApp中没有虚拟方法zzbzo()Z;或者它的超类   java如何在安卓中创建字符串模式   可从Java访问的树莓PI传感器   java 50+GB分隔文件中的大致行数   是否有Java进程内数据库,允许从多表虚拟机访问?   当我使用ArrayList时,HashMap中的Java ArrayList会导致HashMap中的数据被删除。去除   如何将值存储在最佳java集合结构中   java消息Servlet。servlet appServlet的init()引发异常   java正在使用Spring引导生成空日志文件   c#在访问实例变量时使用this关键字是否更有效?   java JScrollPane滚动到最后添加的行   java Vertx抛出IllegalStateException:响应已被写入   java Liferay以编程方式更改portlet列   java下载单个s3对象并将它们合并到单个文件中   java spark数据帧将JSON转换为ORC满足“列模糊异常”