Python中文
首页
教程
问答
标签
搜索
登录
注册
ElementTree的替代XML解析器,以缓解UTF-8的困境?
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我正在用elementtree.parse()函数解析一些XML。它可以工作,除了一些utf-8字符(128以上的单字节字符)。我看到默认的解析器是基于expat的XMLTreeBuilder。</p> <p>是否有一个替代的解析器,我可以使用它可能不那么严格,并允许utf-8字符?</p> <p>这是我在使用默认解析器时遇到的错误:</p> <pre><code>ExpatError: not well-formed (invalid token): line 311, column 190 </code></pre> <p>导致这种情况的字符是单字节x92(十六进制)。我不确定这是不是一个有效的utf-8字符。但最好能处理它,因为大多数文本编辑器都将其显示为:</p> <p><strong>编辑</strong>:字符的上下文是:cant,这里我假设它是一个奇特的使徒,但是在十六进制编辑器中,相同的顺序是:63616e9274</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>字节0x92永远不能作为UTF-8字符的第一个字节<em>有效。但是,它可以作为后续字节有效。有关有效字节序列表,请参见<a href="http://www.cl.cam.ac.uk/~mgk25/unicode.html#utf-8" rel="nofollow noreferrer">this UTF-8 guide</a>。</p> <p>你能告诉我们0x92周围是什么字节吗?XML声明是否包含字符编码?</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何用if条件捕获函数返回值
10 回答
如何用if语句判断列表中是否存在该索引?
8 回答
如何用if语句向量化numpy数组中的最大值?
6 回答
如何用IF语句有条件地保存零碎的结果?
8 回答
如何用if语句测试异常对象?
6 回答
如何用IF语句编写二元函数
2 回答
如何用igraph在python中创建顶点权重的图?
1 回答
如何用ijson和python解析json
3 回答
如何用iloc求子矩阵
4 回答
如何用Imagemagick或PIL绘制高质量的图像笔划(边框)?
3 回答
如何用importlib在python中动态导入模块?
2 回答
如何用import语句重写python内置函数?
5 回答
如何用imshow混合裁剪的强度并显示正确的混合强度?
1 回答
如何用in dictionary解析havin dictionary中的json文件
9 回答
如何用in-Django URL替换%20
2 回答
如何用in\op正确构造查询
4 回答
如何用inbuild对象替换文件
7 回答
如何用inheritan类实现flask restful
2 回答
如何用intersphinx正确地编写对外部文档的交叉引用?
4 回答
如何用int修改LpVariable?
10 回答