基于图形的音译工具
graphtransliterator的Python项目详细描述
图形音译器
一个基于图形的音译工具,允许您转换一个 使用您定义的规则将语言或脚本转换为其他语言或脚本。
- 自由软件:麻省理工学院许可证
- 文档:https://graphtransliterator.readthedocs.io" rel="nofollow">https://graphtransliterator.readthedocs.io
功能
-
提供可配置为转换标记的音译工具。
使用:
- 用户定义的输入类型 令牌 和 令牌类
-
音译规则
基于:
- 输入标记序列
- 在标记序列之前或之后的特定输入标记
- 在指定标记之前或之后的输入标记类
- "on match"规则用于在音译之间插入输出 涉及特定令牌类的规则
- 为空格定义规则,包括其可选合并
-
可以使用:
-
设置
- 一种方便阅读的格式 快速创建音译工具的设置
- "direct" 设置,可能以编程方式通过字典传递
- 根据 音译规则
- 检查音译规则中的歧义性
- 可以提供每个音译规则匹配的详细信息
- 允许在特定位置对所有可能的规则进行可选匹配
- 允许在某些产品中修剪规则
- 验证 ,以及从json序列化 到和反序列化 。 和python数据类型,使用 棉花糖 架构
- 提供对Unicode的完全支持,包括Unicode字符名 以"易于阅读"的yaml格式
- 构造并使用 有向树并执行 最佳优先搜索 在给定的上下文中查找最具体的音译规则