我正在处理兆字节的轻度噪声数据,这些数据被分解成约20 GB的数据帧。每200万行中可能有20行在某些列中有错误数据。我想要将pandas数据帧列快速强制类型转换为int
,只将(NaN)
不能强制为int
的值置零(不要整行置零)
使用pd.to_numeric(df, errors='coerce')
我已经能够删除字符串。我的问题是使用.astype(pd.Int64Dtype())
这已经多次出现错误
"TypeError: cannot safely cast non-equivalent float64 to int64"
解决这个问题最有效的方法是什么
是否尝试添加
downcast
参数:df[col] = pd.to_numeric(df[col], errors='coerce', downcast='integer')
相关问题 更多 >
编程相关推荐