如何在分组结果中添加间隔

df = year place price level 1994 AAA 90 1 1993 BBB 89 1 1994 AAA 91 2 1998 AAA 92 3 1990 BBB 80 0 1994 AAA 90 1 1990 BBB 81 0 1991 BBB 92 1

year_ place_ level_median price_min price_max 0 1990 BBB 0 75 80 1 1991 BBB 1 80 85 2 1993 BBB 1 85 90 3 1994 AAA 1 85 90 4 1998 AAA 3 90 95

2条回答

网友

1楼 · 编辑于 2024-04-23 09:37:44

我想你需要^{}+^{}：

但如果相同的输出需要另一个类别-添加5。不是很理想，但是列被转换成int，加上^{}，再转换成5。你知道吗

bins = range(0, df['price'].max() + 5, 5)
labels_low = range(0, df['price'].max(), 5)

df2['price_min'] = pd.cut(df2['price_min'], bins=bins, labels=labels_low)
df2['price_max'] = pd.cut(df2['price_max'], bins=bins, labels=labels_low).astype(int)
mask = df2['price_min'] == df2['price_max']
df2['price_max'] = df2['price_max'].mask(mask, df2['price_max'] + 5).astype('category')

print (df2)
   year_ place_  level_median  price_min  price_max
0   1990    BBB             0         75         80
1   1991    BBB             1         90         95
2   1993    BBB             1         85         90
3   1994    AAA             1         85         90
4   1998    AAA             3         90         95

不含categorical的溶液：

df2['price_min'] = pd.cut(df2['price_min'], bins=bins, labels=labels_low).astype(int)
df2['price_max'] = pd.cut(df2['price_max'], bins=bins, labels=labels_low).astype(int)
mask = df2['price_min'] == df2['price_max']
df2['price_max'] = df2['price_max'].mask(mask, df2['price_max'] + 5)
print (df2)
   year_ place_  level_median  price_min  price_max
0   1990    BBB             0         75         80
1   1991    BBB             1         90         95
2   1993    BBB             1         85         90
3   1994    AAA             1         85         90
4   1998    AAA             3         90         95

网友

2楼 · 编辑于 2024-04-23 09:37:44

我想如果你想把价格分组在5的范围内，我会用pd.切割创建范围，然后分组。你知道吗

df.groupby(['year','place',pd.cut(df.price,[79,86,91,96,101],labels=['80-85','86-90','91-95','96-100'])]).agg({'price':['min','max'],'level':'median'})

输出：

                 price      level
                   min max median
year place price                 
1990 BBB   80-85    80  81      0
1991 BBB   91-95    92  92      1
1993 BBB   86-90    89  89      1
1994 AAA   86-90    90  91      1
1998 AAA   91-95    92  92      3

让我们试试这个：

df2 = df.groupby(['year',
                  'place',
                   pd.cut(df.price,[i for i in range(np.min(df.price)-5,np.max(df.price)+5,5)])]
                ).agg({'price':['min','max'],'level':'median'})

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何在分组结果中添加间隔

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >