如果给定一组用代码页“xzc”编码的文本“abcdefg foo”,在python中是否可以用代码页解码这些字符?在
更具体地说,我们有一个已知的AFP代码页T1V10500。我们提取的字体是从引用此代码页的AFP中提取的。我们可以提取引用并构建到代码页的路径。在
codepage="/path/to/codepage/T1V10500"
ascii_encoded_extracted_afp_text=extract_afp_text().decode(codepage).encode("ascii")
这是对我希望实现的目标的过度简化,但我希望了解python中是否有这个概念。在
您应该尝试使用ICU
{a2似乎有一个绑定^
如果AFP文件中使用的代码页是通用的(而不是自定义的),那么可以使用ICU轻松地构建一个从代码页指定的编码(T1v10500应该是CP500即IBM EBCDIC International)到ascii或任何所需编码的转换器。 ICU是一个很好的库,大多数IBM AFP文件工具都使用它。在
如果您觉得ICU太麻烦,并且不需要处理其他代码页,您可以构建一个从CP500到ASCII的简单转换表
相关问题 更多 >
编程相关推荐