提供印度文化范围内脚本之间的脚本转换(也称为音译)

aksharamukha的Python项目详细描述


Aksharamukha旨在提供印度文化范围内各种文字之间的音译(也称为文字转换)。这些包括历史脚本,当代的婆罗门衍生/灵感脚本,少数民族印第安语言发明的脚本,与印度语脚本(如阿维斯坦)共存的脚本或与古波斯语相关的语言脚本。它还特别提供主要印度文字(连同僧伽罗语)之间的无损音译。

除了简单的字符映射,askharamukha还尝试实现各种特定于脚本/语言的拼写约定(如已知),如元音长度、双生和鼻化。它还提供了一些定制选项来微调和获得所需的正字法。

Aksharamukha目前支持71个脚本和8个罗马化方法。

支持的脚本是:

^{em1}阿霍姆、阿萨姆、阿维斯坦、巴厘、巴塔克卡罗、巴塔克曼德林、巴塔克帕克帕克、巴塔克多巴、巴塔克西马伦贡、孟加拉、婆罗米、拜克苏基、布吉内塞(隆塔拉)、布希德、缅甸、查克马、查姆、天成、格兰塔、潘迪亚·格兰塔、古吉拉特、哈努诺、爪哇、凯提、卡纳达、卡罗什、高棉(柬埔寨)、霍伊基、库达瓦迪、老挝、老挝(帕里)、莱普查、林布、马拉雅拉姆、马哈贾尼、梅泰梅耶克(曼尼普尔)、莫迪、穆尔塔尼、内瓦(尼泊尔巴沙)、古波斯人、奥里亚人、八斯帕、旁遮普人(古尔木基)、兰加那人(兰萨)、勒姜人、桑塔利人(奥尔基)、索拉什特拉人、悉达姆人、沙拉达人、僧伽罗人、索拉颂鹏人、巽他尼人、西洛蒂纳加里人、塔班瓦人、塔加洛人、泰晤士河人(兰纳人)、塔克里人、泰米尔人,泰米尔语(带全格兰萨语)、泰米尔婆罗米语、泰卢固语、塔纳语(迪维希语)、泰语、藏语、地尔胡塔语(迈希里语)、乌尔都语、瓦特卢图语、瓦朗语(瓦朗语)、扎那巴扎广场、西里尔语(俄语)、伊帕语

支持的罗马化格式有:

哈佛京都大学、itrans、velthuis、iast、iso、titus

用法和示例

请查找使用说明here

联机版本

该包作为联机工具可用here

json资源

您可以将整个映射作为json文件here找到。那些具有近似的映射到泛型方案的字符被标记为''(U+02BD)。例如,Thaana(DHIWEWI)没有/KHA/,因此已经近似到/Ka·/。作为后期处理的一部分,您可能需要删除该字符。与phags pa类似,为了区分元音、元音符号和送气标记,额外添加了/_/。映射完成后,还必须删除该角色。

联系人

如果您有任何问题,请前往Github或邮寄vinodh@virtualvinodh.com

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java是否存在这样一种场景:Java7的Hashmap实现优于Java8的实现   java如何打印这些完整的数组?   java BuildException:未能执行aapt   java如何使用类。未知类型的集合返回的cast()   java准备语句返回错误的值   webview 安卓中的java显示身份验证对话框   java如何重命名列名JPA Hibernate   java查询从特定用户和特定时间段的Oracle表(通过比较原始表和备份表)中选择修改的行   java Youtube视频仅在三星S6设备上加载时自动暂停   未调用java RecyclerView getItemViewType   使用JSch setCommand执行带有源选项的java Shell ping命令时失败   java Hibernate:无法删除|删除分离的实例   Java Spring@MappedSuperclass字段作为子类中的@Id字段   java Android:确定单击了哪个按钮,因为该按钮未在xml中定义   如何计算java阵列内存使用率   使用Java查找按字母顺序排列的第一个字符串   javascript注销功能刷新页面,但页面仍已登录   当接口作为参数提供时,java依赖项注入不起作用   java中带原语的字符串扭曲