Groupby然后检查行匹配并计算该值的并发实例

car color years max_years 0 audi black 1 7 1 audi blue 2 7 2 audi purple 4 7 3 audi black 6 7 4 bmw blue 1 5 5 bmw green 2 5 6 bmw grey 5 5 7 bmw blue 20 5 8 fiat green 1 4 9 fiat green 3 4 10 fiat green 4 4 11 fiat green 10 4

import pandas as pd car = ['audi', 'audi', 'audi', 'audi', 'bmw', 'bmw', 'bmw', 'bmw', 'fiat', 'fiat', 'fiat', 'fiat'] color = ['black', 'blue', 'purple', 'black', 'blue', 'green', 'grey', 'blue', 'green', 'green', 'green', 'green'] years = [1, 2, 4, 6, 1, 2, 5, 20, 1, 3, 4, 10, ] max_years = [7, 7, 7, 7, 5, 5, 5, 5, 4, 4, 4, 4] data = {'car': car, 'color': color, 'years': years, 'max_years': max_years} df = pd.DataFrame(data=data) colors = df.loc[df.years == 1]['color'].values colour_cars = df[(df.years <= df.max_years) & df['color'].isin(colors)].groupby(['car']).size().reset_index(name='colour_cars') print(colour_cars)

1条回答

网友

1楼 · 发布于 2024-06-10 06:12:35

想法是使用^{}由Series创建，使用years == 1过滤数据帧，并按color列进行比较：

colors =  df.loc[df.years == 1].set_index('car')['color']

df1 = (df[(df.years <= df.max_years) & df['car'].map(colors).eq(df['color'])]
         .groupby('car')
         .size()
         .reset_index(name='colour_cars'))
print(df1)

    car  colour_cars
0  audi            2
1   bmw            1
2  fiat            3

或者您可以使用由^{}转换为整数的mask，然后需要按sum计算True的值，并将Seriesdf['car']传递给groupby：

colors =  df.loc[df.years == 1].set_index('car')['color']

df1 = (((df.years <= df.max_years) & df['car'].map(colors).eq(df['color']))
         .view('i1')
         .groupby(df['car'])
         .sum()
         .reset_index(name='colour_cars'))
print(df1)

    car  colour_cars
0  audi            2
1   bmw            1
2  fiat            3

不同的想法是通过^{}和first测试每组的第一种颜色（如果每组的第一年总是1，则解决方案有效）：

df2 = (df[(df.years <= df.max_years)]
           .groupby('car')['color']
           .transform('first').eq(df['color'])
           .view('i1')
           .groupby(df['car'])
           .sum()
           .reset_index(name='colour_cars'))

print(df2)

    car  colour_cars
0  audi            2
1   bmw            1
2  fiat            3

相关问题更多 >

编程相关推荐

热门问题

热门文章