Python新行，包含基于条件的其他行的总和

clientID date assetClass value 10111 01-01-2020 1 10 10111 01-01-2020 2 20 10111 01-01-2020 3 30 10111 02-01-2020 1 15 10111 02-01-2020 2 25 10111 02-01-2020 3 35

clientID date assetClass value 10111 01-01-2020 1 10 10111 01-01-2020 2 20 10111 01-01-2020 3 30 10111 01-01-2020 99 50 10111 02-01-2020 1 15 10111 02-01-2020 2 25 10111 02-01-2020 3 35 10111 02-01-2020 99 60

3条回答

网友

1楼 · 编辑于 2024-05-16 12:42:35

我认为一些布尔掩蔽已经到位。对格式错误表示歉意。在手机上

mask_date = (df[‘date’]==date) mask_assetClass = (df[‘assetClass’].isin(listOfAssets)) mask = (mask_date & mask_assetClass) value_sum = df.loc[mask,’value’].sum()

我不确定这是否是添加新数据的正确方法

df=df.append({‘clientID’:10111,’date’:date,‘assetClass’:99,’value’:value_sum})

网友

2楼 · 编辑于 2024-05-16 12:42:35

我认为您需要使用额外的资产类创建一个新的数据框架。例如：

df_new = df.loc[df['assetClass'].isin([2, 3])].copy()
df_new = df_new.groupby(['date', 'clientID'])['value'].sum().reset_index()
df_new['assetClass'] = 99

df = pd.concat([df, df_new])

我找不到比这更精干的方法了

网友

3楼 · 编辑于 2024-05-16 12:42:35

下面是我测试过的工作代码的简短说明，您不必显式复制

result = df.loc[df['assetClass'].isin([2,3])].groupby(['clientID','date']).sum() #first select rows from 'assetClass' having values 2 and 3. 
#Then groupby clientID and date and then sum
result['assetClass'] = 99 # equate assetClass to 99
df = df.append(result) # merge this to existing dataframe

相关问题更多 >

编程相关推荐

热门问题

热门文章