我正在尝试清理一些XML,这样我就可以用etree在Python中解析它了。基本上,在我的Python脚本读取它之前,我试图转义每个字符串条目中给我的所有特殊字符
'xml.parsers.expat.ExpatError: not well-formed'
因此,当我生成XML字符串条目时,我使用sed
来替换特殊字符,或者用它们的转义版本或者仅仅是一个space
,当我真的不在乎的时候。在
但现在在我生成的XML中,我看到了一个^H
字符,vim将其突出显示为蓝色。在
我试着转义^
,但没用,字符仍然存在,所以我想它一定是某种复合特殊字符。在
唉,为什么这么恶心。无论如何谢谢你的帮助。在
^H
是表示嵌入在文本中的退格字符(ASCII字符8)的常用方法;如果您已经在使用sed
/bash
进行过滤,可以执行以下操作:不过,我觉得你的输入文件中有一个^ H并不是一件好事。。。你是怎么产生的?在
相关问题 更多 >
编程相关推荐