有没有一种方法可以在Python中解析CSV文件,在该方法中,字段可以包含回车字符?

2024-04-25 03:46:35 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一些来自SAS数据集的数据,我们正在将其移植到一个基于web的系统。由于各种错误,我一直无法使用Panda的SAS或STATA导入,因此CSV似乎是最安全的选择,但是,由于它在某些字段中有返回字符,CSV库和Panda都不容易使用。你知道吗

这是不需要自己解析这些文件就可以完成的吗?它们被正确地引用(即,SAS向带有这些返回字符的字段中添加了引号字符,并转义了其他双引号,但是这两个库的函数似乎都将返回字符视为记录终止符,这对于这个用例是不正确的行为)。你知道吗

我试过设置quotechar、escapechar等。似乎这就是CSV阅读器的工作方式。你知道吗

下面是一个简单的例子。第['RSID']行应该只包含整数,但它通常包含来自上一条记录的注释片段。你知道吗

这适用于Python 2.7,csv。版本==1.0

#!/usr/bin/env python

import csv

with open("screening.csv", 'rb') as file:
    reader = csv.DictReader(file, quotechar='"')

    for line in reader:
        print line['RSID']

Tags: csv数据web系统错误记录line字符