我有一个数据集,其中有一些catergorical
列。其中一些列中缺少由np.nan
表示的值。在
我想要LabelEncode
分类数据,稍后Impute
丢失的值。我正在使用sklearn
来完成此操作。但是当我尝试LabelEncode
时,categorical
列(如下面的“nan”值)被视为一个标签,并且它被编码为某个值。在
for x in cat_cols:
encoder = LabelEncoder()
alldata[x] = encoder.fit_transform(alldata[x].astype(str))
我不想发生这种事。我如何编码categorical
值,除了nan
。?在
我知道我可以用某个值替换nan
,然后Encode
。但我不想那样做。我想用nan
替换mode
,以便使用sklearn的Imputer
进行插补。我该怎么做呢。?在
目前没有回答
相关问题 更多 >
编程相关推荐