pandas中函数的矢量化实现

def partnerTransaction(main_df, ptn_code, intent, retail_unique): if intent == 'Frequency': return main_df.query('csp_code == @retail_unique & partner_code == @ptn_code')['tx_amount'].count() elif intent == 'Total_value': return main_df.query('csp_code == @retail_unique & partner_code == @ptn_code')['tx_amount'].sum()

2条回答

网友

1楼 · 编辑于 2024-06-09 15:30:16

如果您想要速度，这里有一个使用bincount的numpy解决方案

from collections import OrderedDict

f, u = pd.factorize(df1.Retail.values)

c = np.bincount(f)
s = np.bincount(f, df1.tx_amount.values).astype(df1.tx_amount.dtype)

pd.DataFrame(OrderedDict(Frequency=c, Total_value=s), u)

          Frequency  Total_value
retail_a          3          130
retail_b          1          100
retail_c          1           20

计时

^{pr2}$

网友

2楼 · 编辑于 2024-06-09 15:30:16

首先将^{}与left join一起使用。在

然后按列tx_amount对^{}进行^{}，并通过^{}函数^{}和{a6}聚合在一起或分别在第二个解中。在

将Series转换为2列DataFrame的最后一个^{}：

如果需要同时输出：

def partnerTransaction_together(df1, df2):
    df = pd.merge(df1, df2, on='Retail', how='left')
    d = {'size':'Frequency','sum':'Total_value'}
    return df.groupby('Retail')['tx_amount'].agg(['size','sum']).rename(columns=d)

print (partnerTransaction_together(df1, df2))
          Frequency  Total_value
Retail                          
retail_a          3          130
retail_b          1          100
retail_c          1           20

但如果需要使用条件：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章