强制将dataframe列强制为int64类型

2024-04-25 18:13:02 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在处理兆字节的轻度噪声数据,这些数据被分解成约20 GB的数据帧。每200万行中可能有20行在某些列中有错误数据。我想要将pandas数据帧列快速强制类型转换为int,只将(NaN)不能强制为int的值置零(不要整行置零)

使用pd.to_numeric(df, errors='coerce')我已经能够删除字符串。我的问题是使用.astype(pd.Int64Dtype())

这已经多次出现错误

"TypeError: cannot safely cast non-equivalent float64 to int64"
  • 一次是由于存在0.5,另一次是由于存在大于Int64容量的21位代码

解决这个问题最有效的方法是什么


热门问题