分类D的标签编码和插补

2024-05-23 18:54:02 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个数据集,其中有一些catergorical列。其中一些列中缺少由np.nan表示的值。在

我想要LabelEncode分类数据,稍后Impute丢失的值。我正在使用sklearn来完成此操作。但是当我尝试LabelEncode时,categorical列(如下面的“nan”值)被视为一个标签,并且它被编码为某个值。在

for x in cat_cols:
    encoder = LabelEncoder()
    alldata[x] = encoder.fit_transform(alldata[x].astype(str))

我不想发生这种事。我如何编码categorical值,除了nan。?在

我知道我可以用某个值替换nan,然后Encode。但我不想那样做。我想用nan替换mode,以便使用sklearn的Imputer进行插补。我该怎么做呢。?在


Tags: 数据in编码encoderfornp分类标签