Zarnegar编码和Unicode文本文件格式转换器

zarnegar-converter的Python项目详细描述


主页:https://github.com/behnam/python-zarnegar-converter

Zarnegar(波斯语:zarneg_r,意为黄金描绘)是 商业的、独立的波斯语/阿拉伯语文字处理程序,为 MS-DOS和Windows。zarnegar的第一个版本(用于dos)发布于 1991年4月至5月,Windows版本从2000年开始提供。

Zarnegar使用了两种不同的字符集和文件格式。

zarnegar1字符集

zarnegar使用了一个基于Iran System的字符编码系统,名为 zarnegar1,早期版本的文本文件格式,直至其“zarnegar” 75“版本。zarnegar1字符集是一个2形式的从左到右可视 编码,意味着每个Perso-Arabic字母都接收不同的 基于其草书连接形式的字符代码,但大多数字母接收 只有2个表单,因为可用的代码点有限2个表单,因为 可用的有限代码点。

此项目具有Zarnegar1编码的部分实现 (zarnegar_converter/zar1_encoding.py)及其二进制文件的完整实现 以及文本文件格式(zarnegar_converter/zar1_file.py)。

Zarnegar75字符集

使用“zarnegar 75”版本的程序,一个新的字符编码系统 引入,文件格式被更改为另一个二进制格式。 zarnegar75字符集是一种4格式的双向编码,这意味着 每个Perso-Arabic字母都接收一个、两个或四个字符的代码, 根据其草书连接形式,这些字母存储在 按语义顺序记忆。

zarnegar75文件格式和编码的支持仍在进行中。

如何使用

$ ./src/zarnegar-converter.py unicode_legacy_lro samples/zar1-sample-text-01.zar
‭                                                          ﻡﺎﯾﺧ ﺕﺎﯾﻋﺎﺑﺭ ﻩﺭﺎﺑﺭﺩ |
‭                                                            ﯽﻧﭘﺍﮊ ﺭﻌﺷ ﺭﺩ ﻭﮐﯾﺎﻫ |

如何贡献

如有任何问题,请在 <;https://github.com/behnam/python-zarnegar-converter/issues>;或提交github 拉取请求。

编码映射(zarnegar1和zarnegar75)可以用 访问更多示例文件。如果您愿意,请写信给<;behnam@zwnj.org>;。 提供(私人或公共)zarnegar源文件以改进此项目。

致谢

感谢斯坦福大学的Cecil H. Green Library,特别是约翰A Eilts和Behzad Allahar,分享他们收集的Zarnegar文件。

也要感谢The Official Website of Ahmad Shamlou分享他们的 文件的收集。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
验证Java验证用户输入的一系列数字   java如何在SpringBoot中字段验证失败时在ConstraintViolationException中获取RequestParam名称   java如何解决Vertx阻塞DNS问题   java意外类型平均值   java如何将dataframe的UUID列转换为包含相同十六进制序列的简单字符串?   身份散列映射的java用法   java无法在eclipse中导入现有项目   进程从运行的java程序中获取CPU号   java将文本视图的特定行滚动到顶部在最后一个屏幕上不起作用   无法初始化java SpringSecurityFilterChain   java当我在项目中使用volatile时,为什么下面的代码显示不同的结果?   是否有转换java的标准方法。util。函数,消费者<T>转换为java。util。作用函数<T,Void>   java nginx分块传输编码失败   java如何将几个IF转换为一个循环   java URI从路径中删除/删除