Python中文
首页
教程
问答
标签
搜索
登录
注册
CSV文件,字段内有引号和逗号字符
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有一堆CSV文件要解析-问题是一半的have引号用作引号,并且在主字段中使用逗号。它们不是真正的CSV,但它们确实有固定数量的可识别字段。dialect=csv.“excel”设置在文件上工作得很好,字段中没有多余的“和”字符。</p> <p>此数据旧/不受支持。我正试着让生活融入其中。</p> <p>例如</p> <pre><code>"AAAAA AAAA AAAA AAAA","AAAAAAAA AAAAAA AAAAA "AAAAAA" AAAAAAAAA AAAAAAAAAAAAAAAAAAAAAAAAA, AAAAA AAAAAAAAA AAAAA AAAAAAAAAA AAAAA, "AAAAA", AAAAAAAAA AAAAAAAA AAAAAAAA AAAAAAA " </code></pre> <p>这将使文件分析器跳闸,并引发一个错误<code>_csv.Error: newline inside string</code>。我通过从第二个字段中删除引号将问题归结为这个问题,csv.reader模块解析文件OK。</p> <p>有些领域是多行的-我不确定这是否重要知道。</p> <p>我一直在探索方言设置,虽然我可以找到“skipinitialspace”,但这似乎并不能解决问题。</p> <p>要清楚-这不是有效的“CSV”,它的数据对象松散地遵循CSV结构,但是在字段测试中有和“chars”。</p> <p>行终止符是\x0d\x0a</p> <p>我在方言模块中尝试了很多doublequote和quoting变量的goes-a t-different排列,但无法正确解析。</p> <p>我不能确信“或”组合只存在于场边界上。</p> <p>这个问题只存在于文件中几个字段中的一个(最后一个),并且有几千个文件。</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>我现在还不能发表评论,所以我会发邮件作为答复。。。</p> <p>假设使用逗号作为分隔符,数据中是否有逗号?如果没有,那么您可以执行大量的查找和替换,在CSV处理之前,将字段的第一个字符和最后一个字符之前的所有引号字符都加倍。</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
Django:。是不是“超级用户”字段不起作用
5 回答
Django:'DeleteQuery'对象没有属性'add'
2 回答
Django:'ModelForm'对象没有属性
10 回答
Django:'python manage.py runserver'返回'TypeError:'WindowsPath'类型的对象没有len()
7 回答
Django:'Python管理.pysyncdb'不创建我的架构表
5 回答
Django:'Python管理.py迁移“耗时数小时(和其他奇怪的行为)
1 回答
Django:'readonly'属性在我的ModelForm上不起作用
8 回答
Django:'RegisterEmployeeView'对象没有属性'object'
5 回答
Django:'str'对象没有属性'get'
2 回答
Django:'创建' 不能被指定为Order模型表单中的值,因为它是一个不可编辑的字段
8 回答
Django:“'QuerySet'类型的对象不是JSON可序列化的”
1 回答
Django:“'utf8'编解码器无法解码位置19983中的字节0xe9:无效的连续字节”,加载临时文件时
3 回答
Django:“<…>”需要有一个字段“id”的值,然后才能使用这个manytomy关系
1 回答
Django:“AnonymousUser”对象没有“get_full_name”属性
5 回答
Django:“ascii”编解码器无法解码位置1035中的字节0xc3:序号不在范围内(128)
8 回答
Django:“BaseTable”对象不支持索引
8 回答
Django:“collections.OrderedDict”对象不可调用
4 回答
Django:“Country”对象没有属性“all”
2 回答
Django:“Data”对象没有属性“save”
6 回答
Django:“datetime”类型的对象不是JSON serializab
6 回答