我只是想从导入的文本文件的每行中删除前45个字符,然后将结果写入新的文本文件。由于某些原因,只有列表/行中的第一项被弄乱,只有前42个字符被删除
我以前遇到过很多次这个问题,也从来没有弄明白为什么会这样,可以用一些外界的智慧!谢谢
这是我的密码:
list1 = []
list2 = []
with codecs.open('FILE.txt', "r", encoding="utf-8") as inputfile:
list1 = [line.strip() for line in inputfile]
list1 = [x.encode('utf-8') for x in list1]
for item in list1:
list2.append(item[45:])
z = open('NEWFILE.txt', 'w');
z.write("\n".join(list2))
z.close()
UTF-8和第一行的3字节移位看起来非常像额外的BOM头
BOM表标题由大多数文本编辑器检测,并且不直接可见(除非使用文本编辑器)
我建议你像这样改变你的内环:
因此,如果行(第一行)以BOM头开始,则添加3个额外的字节
或者在编码完整字符串之前:
物料清单条形图代码取自此Q/A:Python load json file with UTF-8 BOM header
相关问题 更多 >
编程相关推荐