如何分组和删除指定行

id company duration 0 Other Company 5 0 Other Company 19 0 X Company 7 1 Other Company 24 1 Other Company 6 1 X Company 12 2 X Company 9 3 Other Company 30 3 X Company 16

id company duration 0 Other Company 24 0 X Company 7 1 Other Company 30 1 X Company 12 2 X Company 9 3 Other Company 30 3 X Company 16

2条回答

网友

1楼 · 编辑于 2024-04-18 21:30:30

首先使用pd.query()删除“X Company”行，然后使用groupby删除其余的df，如：

import numpy as np
import pandas as pd


ids = [0,0,0,1,1,1,2,3,3]
company = ['Other Company','Other Company','X Company','Other Company','Other Company','X Company','X Company','Other Company','X Company']
duration = [5,19,7,24,6,12,9,30,16]

df = pd.DataFrame({'ids':ids,'company':company,'duration':duration})


df.query("company=='Other Company'").groupby(['ids','company'])['duration'].agg(sum)

你会得到：

ids  company      
0    Other Company    24
1    Other Company    30
3    Other Company    30
Name: duration, dtype: int64

编辑：此外，您可以使用pd.where()、dropna()和pd.pivot_table()的组合：

df.where(df['company']=='Other Company').dropna().pivot_table(['duration'],index=['ids','company'],aggfunc='sum')

你会得到：

duration
ids company                
0.0 Other Company      24.0
1.0 Other Company      30.0
3.0 Other Company      30.0

尽管如此，第一个更快：
每个回路2.03 ms±62.3µs（7次运行的平均值±标准偏差，每个100个回路）
每个回路5.87 ms±23.4µs（7次运行的平均值±标准偏差，每个100个回路）

网友

2楼 · 编辑于 2024-04-18 21:30:30

这有用吗？你知道吗

time_in_company= time_in_company.reset_index(level='company')
time_in_company [time_in_company ['company']!="Other Company"]

相关问题更多 >

编程相关推荐

热门问题

热门文章