import re
f = open(r'YOUR/FILE/HERE',"r+b")
lines = f.readlines()
for idx, row in enumerate(lines):
if "CLASS" in row:
quote_index = [x.start() for x in re.finditer('\"', row)]
if len(quote_index) > 2:
replace_quote = quote_index[1:-1]
correct_row = list(row)
for quotes in replace_quote:
correct_row[quotes] = " "
new_row = "".join(correct_row)
lines[idx] = new_row
f.seek(0)
f.truncate()
f.write(''.join(lines))
f.close()
也许不是最好的解决方案,但是因为你不能用(例如)解析它xml.etree文件由于它是无效的,您可以尝试使用下面的代码。你知道吗
它将:
CLASS
)CLASS
,则找到所有双引号("
)警告:备份您的原始文件,因为这将修改它!!!
这不是100%的万无一失,但可能需要一点运气:
只替换前面没有
=
,后面也没有>
的引号。你知道吗如果} module (PyPI) 可以处理此问题:
=
之后(或>
之前)可能有空格,则不能再使用re
模块,但^{相关问题 更多 >
编程相关推荐