Pandas系列.map将值更改为NaN

2条回答

网友

1楼 · 编辑于 2024-04-26 00:44:48

行为系列.map（）函数用于替换提供的字典中的值，并将其他值更改为NaN。如果要多次运行同一行代码，则需要考虑所有值。您可以使用defaultdict，它允许设置一个默认值，或者只包含第一次运行的结果作为输入，以防第二次运行。改变

dfcat = dataset['label']=dataset.label.map({'ham':1,'spam':0})

至

dfcat = dataset['label']=dataset.label.map({'ham':1,'spam':0,1:1,0:0})

网友

2楼 · 编辑于 2024-04-26 00:44:48

@G.Anderson给出了你第二次重播时为什么会看到那些NaN的原因。你知道吗

至于在Python中处理分类变量的方法，可以使用one hot encoding。玩具示例如下：

import pandas as pd

df = pd.DataFrame({"col1": ["a", "b", "c"], "label": ["ham", "spam", "ham"]})
df_ohe = pd.get_dummies(df, prefix="ohe", drop_first=True, columns=["label"])
df_ohe

然而，它也取决于分类变量的数量和它们的基数（如果高，一个热编码可能不是最好的方法）。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas系列.map将值更改为NaN

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >