用给定的codepag解码字体

2024-05-12 16:53:42 发布

您现在位置:Python中文网/ 问答频道 /正文

如果给定一组用代码页“xzc”编码的文本“abcdefg foo”,在python中是否可以用代码页解码这些字符?在

更具体地说,我们有一个已知的AFP代码页T1V10500。我们提取的字体是从引用此代码页的AFP中提取的。我们可以提取引用并构建到代码页的路径。在

codepage="/path/to/codepage/T1V10500"
ascii_encoded_extracted_afp_text=extract_afp_text().decode(codepage).encode("ascii")

这是对我希望实现的目标的过度简化,但我希望了解python中是否有这个概念。在


Tags: 代码text文本编码fooascii字体解码
1条回答
网友
1楼 · 发布于 2024-05-12 16:53:42

您应该尝试使用ICU

{a2似乎有一个绑定^

如果AFP文件中使用的代码页是通用的(而不是自定义的),那么可以使用ICU轻松地构建一个从代码页指定的编码(T1v10500应该是CP500即IBM EBCDIC International)到ascii或任何所需编码的转换器。 ICU是一个很好的库,大多数IBM AFP文件工具都使用它。在

如果您觉得ICU太麻烦,并且不需要处理其他代码页,您可以构建一个从CP500到ASCII的简单转换表

相关问题 更多 >