我承认我不是Python专家,但我仍然发现处理Pandas DataFrameGroupBy
和{
我有下面的数据帧:
import pandas as pd
import numpy as np
df = pd.DataFrame({'id' : range(1,9),
'code' : ['one', 'one', 'two', 'three',
'two', 'three', 'one', 'two'],
'colour': ['black', 'white','white','white',
'black', 'black', 'white', 'white'],
'irrelevant1': ['foo', 'foo', 'foo','bar','bar',
'foo','bar','bar'],
'irrelevant2': ['foo', 'foo', 'foo','bar','bar',
'foo','bar','bar'],
'irrelevant3': ['foo', 'foo', 'foo','bar','bar',
'foo','bar','bar'],
'amount' : np.random.randn(8)}, columns= ['id','code','colour', 'irrelevant1', 'irrelevant2', 'irrelevant3', 'amount'])
我希望能够得到按code
和{id
。下面的代码进行分组,但保留所有列。在
问题:
1)在gb
中,我如何只存储id
列(甚至没有任何索引)并去掉其余的?在
2)一旦我得到了想要的DataFrameGroupBy
gb
,我如何访问{code=1和colour=white}的{gb.get_group('one','white')
和{
3)如何访问{colour=white},即缺少{
4)最后,manual不是很有帮助,你知道有什么来源的例子可以说明如何创建和访问这些分组对象吗?在
对于您的问题,您甚至不需要执行
groupby
(但是您应该在prose docs中阅读更多关于它的内容。在更好的解决方案是
MultiIndex
:这就解决了1。在
2:使用熟悉的切片语法:
^{pr2}$3:这是一个横截面,使用
.xs
:4:例子比比皆是。检查这里的pandas/groupby标记,this文档的部分是worked on right now,上面链接的散文文档。在
相关问题 更多 >
编程相关推荐