Python编解码器框架的良好文档是否涵盖了官方文档中没有的内容?

2024-03-28 15:56:41 发布

您现在位置:Python中文网/ 问答频道 /正文

Python编解码器框架主要实现标准库的编解码器模块,有大量的小调整。虽然可以挖掘源代码,但我不断发现新规则:

  • 任何以“utf-8”为前缀的编解码器名称,例如“utf-8-with-my-modification”,都会被utf-8解码器捕获,尽管此逻辑不在lib\python3.8\encodings\alias.py或我能找到的任何其他地方
  • 为了使用opencodecs.open生成编码器函数,必须将._is_text_encoding设置为True或在get_registry()调用中设置该参数

但我不断收到越来越多的问题:

  • 我可以添加到内置lib\python3.8\encodings目录之外的编解码器搜索路径吗
  • 满足coding=正则表达式后,是否重新解码文件的前两行
  • 有没有更好的方法让一个文件为coding=行提供多个编解码器,而不是使用一堆符号链接并查看__FILE__
  • 什么是一个最低可行的编解码器?它似乎需要一次性(无状态)和增量编码器/解码器,但默认的流实现可以吗
  • 是否比较了提供不同功能的编解码器的可用子类

真的,我正在寻找一个好的参考,一套论文,战略设计文档,或其他深入的Python编解码器处理。现在,我有一些源代码,关于编写自己的编解码器的初学者教程,还有很多关于人们放弃的描述

我知道这个问题似乎是无止境的,我对StackOverflow并不陌生。这是一个很少被回答的问题


Tags: 模块文件名称框架标准源代码规则lib