Zarnegar编码和Unicode文本文件格式转换器
zarnegar-converter的Python项目详细描述
主页:https://github.com/behnam/python-zarnegar-converter
Zarnegar(波斯语:zarneg_r,意为黄金描绘)是 商业的、独立的波斯语/阿拉伯语文字处理程序,为 MS-DOS和Windows。zarnegar的第一个版本(用于dos)发布于 1991年4月至5月,Windows版本从2000年开始提供。
Zarnegar使用了两种不同的字符集和文件格式。
zarnegar1字符集
zarnegar使用了一个基于Iran System的字符编码系统,名为 zarnegar1,早期版本的文本文件格式,直至其“zarnegar” 75“版本。zarnegar1字符集是一个2形式的从左到右可视 编码,意味着每个Perso-Arabic字母都接收不同的 基于其草书连接形式的字符代码,但大多数字母接收 只有2个表单,因为可用的代码点有限2个表单,因为 可用的有限代码点。
此项目具有Zarnegar1编码的部分实现 (zarnegar_converter/zar1_encoding.py)及其二进制文件的完整实现 以及文本文件格式(zarnegar_converter/zar1_file.py)。
Zarnegar75字符集
使用“zarnegar 75”版本的程序,一个新的字符编码系统 引入,文件格式被更改为另一个二进制格式。 zarnegar75字符集是一种4格式的双向编码,这意味着 每个Perso-Arabic字母都接收一个、两个或四个字符的代码, 根据其草书连接形式,这些字母存储在 按语义顺序记忆。
对zarnegar75文件格式和编码的支持仍在进行中。
如何使用
$ ./src/zarnegar-converter.py unicode_legacy_lro samples/zar1-sample-text-01.zar ﻡﺎﯾﺧ ﺕﺎﯾﻋﺎﺑﺭ ﻩﺭﺎﺑﺭﺩ | ﯽﻧﭘﺍﮊ ﺭﻌﺷ ﺭﺩ ﻭﮐﯾﺎﻫ |
如何贡献
如有任何问题,请在 <;https://github.com/behnam/python-zarnegar-converter/issues>;或提交github 拉取请求。
编码映射(zarnegar1和zarnegar75)可以用 访问更多示例文件。如果您愿意,请写信给<;behnam@zwnj.org>;。 提供(私人或公共)zarnegar源文件以改进此项目。
致谢
感谢斯坦福大学的Cecil H. Green Library,特别是约翰A Eilts和Behzad Allahar,分享他们收集的Zarnegar文件。
也要感谢The Official Website of Ahmad Shamlou分享他们的 文件的收集。
法律通知
zarnegar是sinasoft corporation的商标。这个项目不是 隶属于Sinasoft公司。
版权所有(c)2017 Behnam Esfahbod
此程序是免费软件:您可以在 自由软件发布的GNU通用公共许可条款 基金会,许可证的第3版,或(由您选择)以后的任何版本 版本。
这个程序的发布是希望它能有用,但是没有 保证;甚至没有对商品的适销性或适用性的暗示保证 特殊目的。有关更多详细信息,请参阅GNU通用公共许可证。