分类D的标签编码和插补

2024-05-23 18:54:02 发布

男 | 程序猿一只，喜欢编程写python代码。

我有一个数据集，其中有一些catergorical列。其中一些列中缺少由np.nan表示的值。在

我想要LabelEncode分类数据，稍后Impute丢失的值。我正在使用sklearn来完成此操作。但是当我尝试LabelEncode时，categorical列（如下面的“nan”值）被视为一个标签，并且它被编码为某个值。在

for x in cat_cols:
    encoder = LabelEncoder()
    alldata[x] = encoder.fit_transform(alldata[x].astype(str))

我不想发生这种事。我如何编码categorical值，除了nan。？在

我知道我可以用某个值替换nan，然后Encode。但我不想那样做。我想用nan替换mode，以便使用sklearn的Imputer进行插补。我该怎么做呢。？在

Tags：数据 in 编码 encoder for np 分类标签

0条回答

目前没有回答