我有一个数据帧,它的索引名为city_id
of cities,格式为[city],[state]
(例如,new york,ny
),其中包含列中的整数计数。问题是同一个城市有多个行,我想通过添加它们的列值来折叠共享acity_id
的行。我看了一下groupby()
,但是如何将它应用到这个问题上并不是很明显。
编辑:
示例:我想更改如下:
city_id val1 val2 val3
houston,tx 1 2 0
houston,tx 0 0 1
houston,tx 2 1 1
进入这个:
city_id val1 val2 val3
houston,tx 3 3 2
如果有~10-20k行。
同一行的东西。对不起,不是准确的复制品。
从
我可能会的
或者
第一种方法将索引值(在本例中是
city_id
值)传递给groupby
,并告诉它使用这些值作为组键,第二种方法重置索引,然后选择city_id
列。有关更多示例,请参见文档的this section。注意,DataFrameGroupBy
对象中还有很多其他方法:相关问题 更多 >
编程相关推荐