假设我有以下数据集(2行2列,标题为Char0和Char1):
dataset = [['A', 'B'], ['B', 'C']]
columns = ['Char0', 'Char1']
df = pd.DataFrame(dataset, columns=columns)
我想对Char0和Char1列进行热编码,因此:
df = pd.concat([df, pd.get_dummies(df["Char0"], prefix='Char0')], axis=1)
df = pd.concat([df, pd.get_dummies(df["Char1"], prefix='Char1')], axis=1)
df.drop(['Char0', "Char1"], axis=1, inplace=True)
这将导致一个数据帧,其列标题为Char0_a、Char0_B、Char1_B、Char1_C
现在,我想对每一列都有A、B、C和D的指示(尽管数据集中目前没有“D”)。在本例中,这意味着8列:Char0_A、Char0_B、Char0_C、Char0_D、Char1_A、Char1_B、Char1_C、Char1_D
有人能帮我吗
对所有列使用^{} ,然后对^{} 创建的所有可能的列组合添加^{} :
相关问题 更多 >
编程相关推荐