当给定特定条件时,通过数据帧列中的用户定义函数输入值

2024-04-26 20:48:03 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个pandas数据框,其中一列“a”表示可能有未知值的分类变量,标记为“-1”。我想用随机生成的变量样本替换未知值,考虑到它们的频率

例如:

    'A' 
0   cat
1   dog
2   -1
3   dog
4   dog 

将“-1”值输入(猫、狗)的随机样本及其计数的选择概率,即(1,3)

我可以通过以下方式轻松获得可能的值和计数器:

vals, counts = np.unique(df['A'], return_counts=True), 

然后是

random.choices(vals, counts)  

我可以对它们进行采样,这样就可以构建函数了

如何用应用函数的输出值替换列的条目“-1”


Tags: 数据函数标记pandas方式计数器分类概率
1条回答
网友
1楼 · 发布于 2024-04-26 20:48:03

如果我们有示例输入和输出,这将有助于理解您的问题,但是您应该能够在本系列中使用np.where 差不多

df['A']=np.where(df['A'] == -1,func(),df['A']

相关问题 更多 >