pythonscsv嗅探器在windows和linux中的不同行为

pathname = dlg.GetPath() try: self.file = open(pathname, 'r', encoding='utf-8') except IOError: wx.LogError("Cannot open file '%s'." % ntpath.basename(self.file.name)) return # check for file format with sniffer sample = self.file.read(1024) try: dialect = csv.Sniffer().sniff(sample) except UnicodeDecodeError: wx.LogError("Cannot decode file '%s'." % ntpath.basename(self.file.name)) return except csv.Error: wx.LogError("Cannot determine dialect of '%s'." % ntpath.basename(self.file.name)) return

2条回答

网友

1楼 · 编辑于 2024-04-23 16:12:20

终于找到了这个错误的原因。它与换行符结尾无关。我正在使用python3.6.4，并发现csv.py文件在这个版本中有一个错误：第220行的regex显示：

r'(?P<delim>>[^\w\n"\'])(?P<space> ?)(?P<quote>["\']).*?(?P=quote)(?:$|\n)',  # ,".*?"

但应该是：

^{pr2}$

从python3.6.5开始。这个错误似乎被修复了

网友

2楼 · 编辑于 2024-04-23 16:12:20

默认的记录结束分隔符在windows和linux之间是不同的。通常，在windows上，记录将以一个CR-LF“对”终止，而在*nix上，通常只有一个LF。在这种情况下，您的嗅探器可能会在windows模式下自行修复，并且需要帮助来决定实际的行终止符应该是什么。在

从the docs看来，sniffer默认为/r/n，我认为这是windows风格的。它应该能应付交替的线路终端，但也许有什么东西是被迫的。如果数据文件中的记录长度超过1024，或者没有足够的时间对行结束符进行足够的采样以正确猜测格式，那么这可能与此有关。在

相关问题更多 >

编程相关推荐

热门问题

热门文章