每列模式的多列Pandas Fillna

网友

1楼 · 编辑于 2024-06-09 20:34:04

如果要用数据帧df的某些列中的mode来填充缺少的值，只需^{}通过Series创建，通过^{}按位置选择：

cols = ["workclass", "native-country"]
df[cols]=df[cols].fillna(df.mode().iloc[0])

或：

df[cols]=df[cols].fillna(mode.iloc[0])

你的解决方案：

df[cols]=df.filter(cols).fillna(mode.iloc[0])

样品：

df = pd.DataFrame({'workclass':['Private','Private',np.nan, 'another', np.nan],
                   'native-country':['United-States',np.nan,'Canada',np.nan,'United-States'],
                   'col':[2,3,7,8,9]})

print (df)
   col native-country workclass
0    2  United-States   Private
1    3            NaN   Private
2    7         Canada       NaN
3    8            NaN   another
4    9  United-States       NaN

mode = df.filter(["workclass", "native-country"]).mode()
print (mode)
  workclass native-country
0   Private  United-States

cols = ["workclass", "native-country"]
df[cols]=df[cols].fillna(df.mode().iloc[0])
print (df)
   col native-country workclass
0    2  United-States   Private
1    3  United-States   Private
2    7         Canada   Private
3    8  United-States   another
4    9  United-States   Private

网友

2楼 · 编辑于 2024-06-09 20:34:04

你可以这样做：

df[["workclass", "native-country"]]=df[["workclass", "native-country"]].fillna(value=mode.iloc[0])

例如

    import pandas as pd
d={
    'key3': [1,4,4,4,5],
    'key2': [6,6,4],
    'key1': [6,4,4],
}

df=pd.DataFrame.from_dict(d,orient='index').transpose()

那么df

  key3  key2    key1
0   1   6       6
1   4   6       4
2   4   4       4
3   4   NaN     NaN
4   5   NaN     NaN

然后通过做：

l=df.filter(["key1", "key2"]).mode()
df[["key1", "key2"]]=df[["key1", "key2"]].fillna(value=l.iloc[0])

我们知道df是

  key3  key2    key1
0   1   6        6
1   4   6        4
2   4   4        4
3   4   6        4
4   5   6        4

网友

3楼 · 编辑于 2024-06-09 20:34:04

我认为使用dict作为fillna参数'value'是最干净的

参考号：https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.fillna.html

根据@miriam farber的响应创建玩具df

import pandas as pd
d={
    'key3': [1,4,4,4,5],
    'key2': [6,6,4],
    'key1': [6,4,4],
}

d_df=pd.DataFrame.from_dict(d,orient='index').transpose()

创建dict

mode_dict = d_df.loc[:,['key2','key1']].mode().to_dict('records')[0]

在fillna方法中使用此dict

d_df.fillna(mode_dict, inplace=True)

相关问题更多 >

编程相关推荐

热门问题

热门文章

每列模式的多列Pandas Fillna

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >