我有一个df
,其中包含分类和数字数据
df = {'Name':['Tom', 'nick', 'krish', 'jack'],
'Address':['Oxford', 'Cambridge', 'Xianjiang', 'Wuhan'],
'Age':[20, 21, 19, 18],
'Weight':[50, 61, 69, 78]}
df = pd.DataFrame(df)
我需要将每列中的50%随机替换为NaN,因此结果可能如图所示
如何用最有效的技术做到这一点,因为我有大量的行和列,我会重复很多次
Tags:
可以通过在元组的范围内取随机数,并在它们上面运行循环,并将其视为用NaAN
替换的索引。例如: 如果你有10个元组 从随机数发电机组范围到0到9,以及 并以上述运算结果为指标,用NaN代替
我建议使用
argpartition
而不是argsort
,因为执行的排序非常无用,因此将性能提高三倍于以前的答案(主要是受@jezrael启发):性能比较
将} 一起使用
apply
与^{相关问题 更多 >
编程相关推荐