我有一个csv,在某个时候变成这样:
57926,57927,"79961', 'dsfdfdf'",fdfdfdfd,0.40997048,5 x fdfdfdfd,
57927,57928,"fb0ec52878b165aa14ae302e6064aa636f9ca11aa11f5', 'fdfd'",fdfdfd,1.64948454,20 fdfdfdfd,"
US
"
57928,57929,"f55bf599dba600550de724a0bec11166b2c470f98aa06', 'fdfdf'",fdfdfd,0.81300813,10 fdfdfdfd,"
US
"
57929,57930,"82e6b', 'reetrtrt'",trtretrtr,0.79783365,fdfdfdf,"
NL
我想把这些空行去掉。到目前为止,我尝试了以下脚本:
^{pr2}$以及
df=df.replace(r'\r\r\r\r\n\t\t\t\t\t\t', '',regex=True)
因为这是我得到的错误。到目前为止,我还没有清理我的文件,做我想做的事情。如果我不确定我使用的方法不正确。我正在使用pandas来处理我的数据集。有什么帮助吗?
““
我将首先
open
并对文件的数据进行预处理,然后将文件数据传递给pandas基于您提供的文件片段,下面是如何将Pandas作为NaNs存储的空行替换为空字符串。在
这将允许您在基本Pandas数据帧上执行所有操作,而无需多次读取文件。尽管如此,我还是建议在加载数据之前对其进行预处理,因为在非统一布局中处理数据通常是一种更安全的方法。在
尝试:
此指令不使用任何内容替换}。
由于
\n
、\r
和{inplace
参数,不需要再次将结果替换为df
。在替代方法:使用
to_replace=r'\s'
来消除空格, 可能只在选定的列中。在相关问题 更多 >
编程相关推荐