背景
我想确定一个变量从1990年到2014年不同时期的全球累积值,即1990年、2000年、2010年(分别为30年)。我有不同国家的年度数据。然而,数据可用性并不统一
现有问题
使用R:1
这些问题的答案并不针对当前问题
当前问题
如何使用熊猫的特征/工具获得不同时期的全球总和
预期结果
1990-2000 x1
2000-2010 x2
2010-2015 x3
目前使用的方法
data_binned = data_pivoted.copy()
decade = []
# obtaining decade values for each country
for i in range(1960, 2017):
if i in list(data_binned):
# adding the columns into the decade list
decade.append(i)
if i % 10 == 0:
# adding large header so that newly created columns are set at the end of the dataframe
data_binned[i *10] = data_binned.apply(lambda x: sum(x[j] for j in decade), axis=1)
decade = []
for x in list(data_binned):
if x < 3000:
# removing non-decade columns
del data_binned[x]
# renaming the decade columns
new_names = [int(x/10) for x in list(data_binned)]
data_binned.columns = new_names
# computing global values
global_values = data_binned.sum(axis=0)
这是一种非最佳方法,因为使用熊猫的经验较少。请推荐一种更好的方法,利用大熊猫的特征。多谢各位
如果我让^{} 调用
df
的样子如下:我可以用几十年的统计数据制作另一个名为} ,如下所示:
df_decades
的^{这背后的想法是迭代
df
中列名提供的所有可能的十年,过滤这些列,这些列是十年的一部分,并将它们聚合最后,我可以将这些数据帧合并在一起,这样我的数据帧
df
可以通过第二个数据帧df_decades
的几十年统计数据来丰富相关问题 更多 >
编程相关推荐