XML解析^H字符/符号?

2024-06-17 13:11:00 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试清理一些XML,这样我就可以用etree在Python中解析它了。基本上,在我的Python脚本读取它之前,我试图转义每个字符串条目中给我的所有特殊字符

'xml.parsers.expat.ExpatError: not well-formed'

因此,当我生成XML字符串条目时,我使用sed来替换特殊字符,或者用它们的转义版本或者仅仅是一个space,当我真的不在乎的时候。在

但现在在我生成的XML中,我看到了一个^H字符,vim将其突出显示为蓝色。在

我试着转义^,但没用,字符仍然存在,所以我想它一定是某种复合特殊字符。在

唉,为什么这么恶心。无论如何谢谢你的帮助。在


Tags: 字符串脚本not条目xml字符sedetree
1条回答
网友
1楼 · 发布于 2024-06-17 13:11:00

^H是表示嵌入在文本中的退格字符(ASCII字符8)的常用方法;如果您已经在使用sed/bash进行过滤,可以执行以下操作:

cat infile | sed s/$'\b'// > outfile

不过,我觉得你的输入文件中有一个^ H并不是一件好事。。。你是怎么产生的?在

相关问题 更多 >