我有一个pandas数据框,其中一列“a”表示可能有未知值的分类变量,标记为“-1”。我想用随机生成的变量样本替换未知值,考虑到它们的频率
例如:
'A'
0 cat
1 dog
2 -1
3 dog
4 dog
将“-1”值输入(猫、狗)的随机样本及其计数的选择概率,即(1,3)
我可以通过以下方式轻松获得可能的值和计数器:
vals, counts = np.unique(df['A'], return_counts=True),
然后是
random.choices(vals, counts)
我可以对它们进行采样,这样就可以构建函数了
如何用应用函数的输出值替换列的条目“-1”
如果我们有示例输入和输出,这将有助于理解您的问题,但是您应该能够在本系列中使用
np.where
差不多相关问题 更多 >
编程相关推荐