在数据帧中,我尝试使用“平均值”列将值分为3个存储单元。在
num_countries mean
0 'Europe', 25 161.572326
1 'Asia', 7 607.983830
2 'North America', 3 1560.438095
3 'South America', 2 199.148901
4 'Australia', 1 218.021429
5 'Africa' 1 213.846154
6 'Oceania', 1 39.378571
我的箱子是
^{pr2}$结果是[-inf,-100.388312373895811957.6423998696303,inf]
当我试着把它们放进垃圾箱时,就会发生这种情况。在
^{3}$
我会用
np.searchsorted
如果你愿意,我们可以用标签
^{pr2}$从您的数据开始:
我认为主要的问题是引用
^{pr2}$mean
列的方式。请注意,mean
也是pd.DataFrame
对象上的一阶函数。注意:如果要访问
^{3}$mean
列(而不是mean
函数),则需要使用df['mean']
进行访问。在或者,您是否考虑过
pd.qcut
?你可以很简单地传递箱子的数量,你的数据就会被分为那么多分位数。在你上面的方法将你的大部分数据存储到一个类别中,所以我相信这对你来说会更好。在
相关问题 更多 >
编程相关推荐