从使用python pandas创建的透视表中筛选和选择

import pandas as pd import numpy as np In [1027]: df = pd.DataFrame({'A' : ['one', 'one', 'two', 'three'] * 6, 'B' : ['A', 'B', 'C'] * 8, 'C' : ['foo', 'foo', 'foo', 'bar', 'bar', 'bar'] * 4, 'D' : np.random.randn(24), 'E' : np.random.randn(24)}) In [1029]: pd.pivot_table(df, values='D', rows=['A', 'B'], cols=['C']) Out[1029]: C bar foo A B one A -1.154627 -0.243234 B -1.320253 -0.633158 C 1.188862 0.377300 three A -1.327977 NaN B NaN -0.079051 C -0.832506 NaN two A NaN -0.128534 B 0.835120 NaN C NaN 0.838040

2条回答

网友

1楼 · 编辑于 2024-05-23 14:25:09

只是在前面的答案中添加信息。当您尝试在python3中使用pivoted.ix['one']时，会得到以下消息：

/usr/lib/python3.7/site-packages/ipykernel_launcher.py:7: DeprecationWarning: .ix is deprecated. Please use .loc for label based indexing or .iloc for positional indexing
See the documentation here: http://pandas.pydata.org/pandas-docs/stable/indexing.html#ix-indexer-is-deprecated import sys

因此，在这个版本的python中，请使用以下代码：

pivoted.loc['one']

网友

2楼 · 编辑于 2024-05-23 14:25:09

数据透视表返回一个数据帧，因此您可以通过执行以下操作进行简单筛选：

In [15]: pivoted = pivot_table(df, values='D', rows=['A', 'B'], cols=['C'])

In [16]: pivoted[pivoted.foo < 0]
Out[16]: 
C             bar       foo
A     B                    
one   A -0.412628 -1.062175
three B       NaN -0.562207
two   A       NaN -0.007245

你可以用一些像

pivoted.ix['one']

选择所有A系列组

或者

pivoted.ix['one', 'A']

选择不同的A和B系列组

相关问题更多 >

编程相关推荐

热门问题

热门文章