我有一个.csv文件,在该文件的开头添加了一列。 然后,我需要更改特定工具的编码以正确读取
该文件大约有9800行。当我在添加列之前和之后计算行数时,得到的数字是相同的。但是,当我改变编码后计数时,我得到的更少。奇怪的是,当我打开文件时,我可以看到所有的行都在那里
代码如下:
file = open("ob_input.csv")
outfile = open("ob_output.csv", "w")
outfile.write("COLUMNS\n")
print "\n*************** Adding Date Column ***************"
date = time.strftime("%m/%d/%Y %H:%M:%S,")
i1 = 0
for line in file:
i1 = i1 + 1
if "Asset ID,CI Type" in line:
pass
else:
newline = date + line
outfile.write(newline)
file.close()
outfile.close()
time.sleep(2)
print "Done! Total lines: %d" % i1
print "\n**************** Changing Encoding ***************"
sourceEncoding = "utf-8"
targetEncoding = "utf-8-sig"
source = open("ob_output.csv")
target = open("ob_finle.csv", "w")
target.write(unicode(source.read(), sourceEncoding).encode(targetEncoding))
i2 = sum(1 for line in open('ob_finle.csv'))
print "Done! Total lines: %d" % i2
我得到的结果是:
*************** Adding Date Column ***************
Done! Total lines: 9741
**************** Changing Encoding ***************
Done! Total lines: 9729
9741是正确的。当我在编码更改后打开文件时,得到9741行。我不知道为什么它的计数越来越少
我所做的是确保更改文件后不会丢失数据
您需要使用目标编码打开文件:
使用
io.open
允许关键字参数encoding
,并使其在Python 2和3中工作,因为:Python 3:
相关问题 更多 >
编程相关推荐