使用简单填充器方法替换数据集中的NaN值。
Replace-Missing-Values-101883055的Python项目详细描述
替换缺少的值
一个python包,用于使用简单填充器方法替换数据集中的NaN值。在
缺少值可能导致结果不一致。我们可以用丢失的行替换计算出的数据,也可以忽略一些列。 当数据集太小时,我们可以™即使行数据中缺少列,也不能丢失。在这些情况下,我们将研究用一些值替换列数据。 插补是解决缺失数据问题的另一种方法。 缺少的列值将被另一个计算值替换。可能存在这样的情况:数据集很小,或者数据集的每一行都代表一个临界值。 在这些情况下,我们无法从数据集中删除行。可以对缺失值进行插补。 有不同的策略来定义缺失值的替代物。 该值可由以下值代替: 训练数据集中可用的其他列值的平均值。 训练数据集中其他可用值的中值。 替换为训练数据集中最频繁的值。在
- 项目
标签: