搜索中文拼音并用html包装。
colorize-pinyin的Python项目详细描述
搜索中文拼音并用html包装。
使用示例
>>> colorized_HTML_string_from_string('nǐ hǎo') '<span class="pinYinWrapper"><span class="t3">nǐ</span> <span class="t3">hǎo</span></span>'>>> ranges_of_pinyin_in_string('nǐ hǎo') [Range(location=0, length=2), Range(location=3, length=3)] # == [(0, 2), (3, 3)]
要求
lxml仅当您要使用dom时才需要。但它没有列在需求中,因为如果您想使用它们,您肯定已经在板上有了lxml;对于其他情况,我们不需要额外的第三方lib。
用于标记为[*]的lxml的函数。
功能
通过将包含拼音的子文本节点替换为 包装器元素:
colorize_DOM[*]
撤消着色:
uncolorize_DOM[*]
用HTML在纯文本字符串中检测和包装拼音:
colorized_HTML_string_from_string
执行同样的操作,但返回一个包装器–dom元素:
colorized_HTML_element_from_string[*]
在文本字符串中搜索拼音:
ranges_of_pinyin_in_string
找出哪个音调有拼音单词:
determine_tone
从拼音字符串中删除音调(变音符号):
lowercase_string_by_removing_pinyin_tones
常数
PINYIN_LIST–所有可能的拼音单词的特殊排序列表。
PINYIN_LIST_BY_LEN–与PINYIN_LIST相同,但按长度降序分组。
PINYIN_WRAPPER_CLASS–由[un]colorize_DOM使用的默认类。
课程
Range–具有[0]位置和[1]长度的2个命名元组。