我有一些来自SAS数据集的数据,我们正在将其移植到一个基于web的系统。由于各种错误,我一直无法使用Panda的SAS或STATA导入,因此CSV似乎是最安全的选择,但是,由于它在某些字段中有返回字符,CSV库和Panda都不容易使用。你知道吗
这是不需要自己解析这些文件就可以完成的吗?它们被正确地引用(即,SAS向带有这些返回字符的字段中添加了引号字符,并转义了其他双引号,但是这两个库的函数似乎都将返回字符视为记录终止符,这对于这个用例是不正确的行为)。你知道吗
我试过设置quotechar、escapechar等。似乎这就是CSV阅读器的工作方式。你知道吗
下面是一个简单的例子。第['RSID']行应该只包含整数,但它通常包含来自上一条记录的注释片段。你知道吗
这适用于Python 2.7,csv。版本==1.0
#!/usr/bin/env python
import csv
with open("screening.csv", 'rb') as file:
reader = csv.DictReader(file, quotechar='"')
for line in reader:
print line['RSID']
目前没有回答
相关问题 更多 >
编程相关推荐