使用sklearn SimpleImputer策略常量和使用fillna(值)有什么区别?
例如:SimpleImputer(missing_values=np.nan, strategy='constant', fill_value = 0)
vsdf.fillna(0)
即使对于strategy=mean,我们也可以使用df.fillna(df.mean)
。
使用simpleImputer,我们仍然需要调整数据帧和更多行。
fillna是短代码。
当我们需要使用simpleImputer而不是fillna时是什么情况?simpleImputer更快吗
我认为:两者都是用来填充缺失的值。如果项目中没有使用
pandas
,那么SimpleImputer
是一个很好的选择,因为它是一个内置的sklearn
功能median
和most-frequent
df.fillna()
是最常用的,可用于复杂场景李>我认为,当您试图部署模型时,使用sklearn在数据集上拥有一个转换管道会更干净。在训练或推断之前,您甚至可以将数据集上的所有转换添加到一个漂亮的管道包装器中,例如^{} 对象。如果使用
sklearn
实现,以后集成和调试会更容易相关问题 更多 >
编程相关推荐