OneHotEncode两个分类变量,在sklearn中各有3个级别

2024-04-20 04:00:27 发布

您现在位置:Python中文网/ 问答频道 /正文

我必须将两个分类变量A(levels=A1A2A3)和{}(levels=B1B2B3)编码为虚拟变量。我的理解是,sklearn中的OneHotEncoder会对我的变量进行编码,比如,A1+A2+A3+B1+^{{}+B3=2(也就是K取一方案)。在拟合模型时,这种方法是否会导致共线等问题?在

为什么sklearn提供K-1编码选项的方式与pandas.get_dummies与{相同?或者,我错过了什么?在


Tags: 方法模型a2编码a1方案分类sklearn