样本数据:
id val1 val2 val3 val4 val5 val6 val7
///+8yr NaN 0.0 2.0 NaN 1 3 23
///1vjh NaN NaN NaN NaN NaN 7 62
///4wu 3 NaN 6 NaN 7 8 180
本质上,我希望能够获取这些行中超过5的每个值,并将它们替换为一些类别变量(即“greaterthan5”)。对于val7,我希望根据30的间隔对它们进行分组,例如,0-30组合在一起,31-60组合在一起。在
我可以做一个for循环,但我不知道是否有更有效的方法。在
Tags:
你有两个问题。用
'larger than 5'
替换大于5的值的第一个问题可以通过布尔索引来实现,第二个问题的分组可以用pd.cut()
来实现演示:
第1部分
获取不满足大于5标准的值
^{pr2}$获取大于5的值
更新你的逻辑
用逻辑更新
rest
根据逻辑1,用更新后的值替换原始数据框的值
第二部分
获取垃圾箱
创建新系列
将其添加到数据帧中
也可以通过将值传递给
pd.cut()
中的labels参数来设置组标签相关问题 更多 >
编程相关推荐