Pandas：用特定指数匹配减去两个系列

from StringIO import StringIO import pandas as pd raw_data="""day name time 1 foo 10 1 foo 9 1 bar 4 2 foo 12 2 foo 13 3 bar 3 3 bar 5 5 foo 8 5 bar 5 5 foo 9 5 bar 1 """ df = pd.read_csv(StringIO(raw_data), sep=' ') grouped_by_day_and_name = df.groupby(['day', 'name'])

2条回答

网友

1楼 · 编辑于 2024-04-24 20:05:37

我认为您可以将^{}与aggfunc=min一起使用，然后减去bar和{}列：

from StringIO import StringIO 
import pandas as pd

raw_data="""day name time
1 foo 10
1 foo 9
1 bar 4
2 foo 12
2 foo 13
3 bar 3
3 bar 5
5 foo 8
5 bar 5
5 foo 9
5 bar 1
"""

df = pd.read_csv(StringIO(raw_data), sep=' ')
print df
    day name  time
0     1  foo    10
1     1  foo     9
2     1  bar     4
3     2  foo    12
4     2  foo    13
5     3  bar     3
6     3  bar     5
7     5  foo     8
8     5  bar     5
9     5  foo     9
10    5  bar     1

^{pr2}$

网友

2楼 · 编辑于 2024-04-24 20:05:37

我想你想做的是一个“内部”连接。此类型的联接执行要查找的索引匹配：

from StringIO import StringIO
import pandas as pd

raw_data="""day name time
1 foo 10
1 foo 9
1 bar 4
2 foo 12
2 foo 13
3 bar 3
3 bar 5
5 foo 8
5 bar 5
5 foo 9
5 bar 1
"""

df = pd.read_csv(StringIO(raw_data), sep=' ')

# Split the dataset into the two workers
foo = df.query('name == "foo"')
bar = df.query('name == "bar"')

# Find for each day the shortest working time
foo = foo.groupby('day').agg('min')
bar = bar.groupby('day').agg('min')

# Perform an inner join of the two workers, this only keeps days
# where both workers have been working
joined = foo.join(bar, how='inner', lsuffix='_foo', rsuffix='_bar')

# Compute the difference in minimum working times
diff = joined['time_bar'] - joined['time_foo']

print diff

结果：

^{pr2}$

如果您希望NaN在只有一个工人工作的日子，您可以执行“outer”联接：

# Perform an outer join of the two workers, this only keeps days
# where both workers have been working
joined = foo.join(bar, how='outer', lsuffix='_foo', rsuffix='_bar')

# Compute the difference in minimum working times
diff = joined['time_bar'] - joined['time_foo']

print diff

结果：

day
1    -5
2   NaN
3   NaN
5    -7
dtype: float64

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas：用特定指数匹配减去两个系列

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >