假设我有一个数据帧作为
age Late
1 1
2 5
3 48
4 46
5 6
。。。你知道吗
我想用中位数Late
替换Late
中所有46或48的值。我相信命令是正确的
trainDF.groupby('Late').transform(getmedian)
然而,结果是整个数据帧trainDF
?或者只是Late
列?你知道吗
也就是说,下面的说法有道理吗?你知道吗
trainDF=trainDF.groupby('Late').transform(getmedian)
或者下面的说法有意义吗?你知道吗
newLate = trainDF.groupby('Late').transform(getmedian)
我试过了
newLate = trainDF.groupby('Late').transform(getmedian)
newLate.max()
打印出Unnamed: 0
和trainDF['newLate'].max()
打印出KeyError: 'newLate'
如果我尝试
trainDF=trainDF.groupby('Late').transform(getmedian)
然后打印出来
trainDF['Late'].max()
上面写着KeyError: 'Late'
我应该如何存储新的数据帧来替换Late
中的46和48个值?我之所以问这个问题,是因为我最终想通过打印修改后的Late
列的最大值来确保这一点,并确保它显示6(或任何小于46的数字),而不是48
你在这里问了很多问题,但我要谈谈最主要的问题:
您可以这样做:
这里有一个很好的一行给你:
请记住,groupby并没有真正应用于您的案例,它返回一个
DataFrame
-ish对象相关问题 更多 >
编程相关推荐