搜索中文拼音并用html包装。

colorize-pinyin的Python项目详细描述


搜索中文拼音并用html包装。

拼音着色

搜索中文拼音并用html包装。

模块提供了一些有用的汉语拼音功能, “抄写汉语发音的语音系统 拉丁字母中的汉字“(c)wikipedia 是的。

使用示例

>>> colorized_HTML_string_from_string('nǐ hǎo')
'<span class="pinYinWrapper"><span class="t3">nǐ</span> <span class="t3">hǎo</span></span>'
>>> ranges_of_pinyin_in_string('nǐ hǎo')
[Range(location=0, length=2), Range(location=3, length=3)]  # == [(0, 2), (3, 3)]

要求

lxml仅当您要使用dom时才需要。但它没有列在需求中,因为如果您想使用它们,您肯定已经在板上有了lxml;对于其他情况,我们不需要额外的第三方lib。

用于标记为[*]lxml的函数。

功能

通过将包含拼音的子文本节点替换为 包装器元素:

colorize_DOM[*]

撤消着色:

uncolorize_DOM[*]

用HTML在纯文本字符串中检测和包装拼音:

colorized_HTML_string_from_string

执行同样的操作,但返回一个包装器–dom元素:

colorized_HTML_element_from_string[*]

在文本字符串中搜索拼音:

ranges_of_pinyin_in_string

找出哪个音调有拼音单词:

determine_tone

从拼音字符串中删除音调(变音符号):

lowercase_string_by_removing_pinyin_tones

常数

PINYIN_LIST–所有可能的拼音单词的特殊排序列表。

PINYIN_LIST_BY_LEN–与PINYIN_LIST相同,但按长度降序分组。

PINYIN_WRAPPER_CLASS–由[un]colorize_DOM使用的默认类。

课程

Range–具有[0]位置和[1]长度的2个命名元组。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java置换相关算法   在Java中读取/打开文本文件   java为什么这段代码不适用于CodeEval?   java如何将日历转换为JSON   从txt文件中读取字符串并将其存储到java中的字符数组中   字符编码Java ResourceBundles umlauts搞砸了   java为什么hashmap会根据总大小而不是填充的存储桶调整大小   java如何将Excel单元格中的数字字符串读取为字符串(而不是数字)?   java Guava的LocalCache无法使用,为什么?   java有没有办法强制JVM在单个处理器或内核上运行   java Eclipse不安装软件   将字节转换为java字符串(可能是汉字)   Java正则表达式:提取函数名   JavaTestNG:如何从多个类中指定测试方法顺序?