数据帧：基于多个条件创建列

Lead ID Lead Status Duration Target 1-1H9C0XL Too Small -0.466177 1 1-1H9G33C A -0.620709 0 1-1H9G33C A -0.500709 0 1-1H9G33C A 0.337401 0 4-1HFORF8 No Fit -0.343840 1 4-1HFSXOG No Fit -0.124920 1 4-1HLQ2IJ A -0.330962 0 4-1HLQ2IJ A 0.130818 0 4-1HLQ2IJ A -0.400817 0 4-1HLQ2IJ A 0.240818 0

Lead ID Lead Status Duration Target 1-1H9C0XL Too Small -0.466177 1 1-1H9G33C A -0.620709 1 1-1H9G33C A -0.500709 1 1-1H9G33C A 0.337401 0 4-1HFORF8 No Fit -0.343840 1 4-1HFSXOG No Fit -0.124920 1 4-1HLQ2IJ A -0.330962 1 4-1HLQ2IJ A 0.130818 1 4-1HLQ2IJ A -0.400817 1 4-1HLQ2IJ A 0.240818 0

2条回答

网友
1楼 · 编辑于 2024-04-19 07:07:35

这是一个惯用的、有表现力的答案。你知道吗
df['Target'] += df.sort_values('Duration')\ .duplicated(subset=['Lead ID', 'Lead Status'], keep='last')
如果不假定唯一行具有1，则可以执行以下操作。你知道吗
df1 = df.sort_values('Duration') unique = ~df1.duplicated(subset=['Lead ID', 'Lead Status'], keep=False) * 1 first = df1.duplicated(subset=['Lead ID', 'Lead Status'], keep='last') * 1 df['Target'] = unique + first
还有一种不太有效的方法：
df.groupby(['Lead ID', 'Lead Status'])['Duration']\ .transform(lambda x: 1 if len(x) == 1 else x < x.max()) Lead ID Lead Status Duration Target 0 1-1H9C0XL Too Small -0.466177 1 1 1-1H9G33C A -0.620709 1 2 1-1H9G33C A -0.500709 0 3 1-1H9G33C A 0.337401 1 4 4-1HFORF8 No Fit -0.343840 1 5 4-1HFSXOG No Fit -0.124920 1 6 4-1HLQ2IJ A -0.330962 1 7 4-1HLQ2IJ A 0.130818 1 8 4-1HLQ2IJ A -0.400817 1 9 4-1HLQ2IJ A 0.240818 0

网友
2楼 · 编辑于 2024-04-19 07:07:35

试试这个（假设您的df已排序）
df.loc[df[df.duplicated(['LeadID','LeadStatus'],keep=False)].drop_duplicates(['LeadID','LeadStatus'],keep='first').index,'Target']=1 df Out[895]: LeadID LeadStatus Duration Target 0 1-1H9C0XL TooSmall -0.466 1 1 1-1H9G33C A -0.621 1 2 1-1H9G33C A 0.337 0 3 4-1HFORF8 NoFit -0.344 1 4 4-1HFSXOG NoFit -0.125 1 5 4-1HLQ2IJ A -0.331 1 6 4-1HLQ2IJ A 0.241 0
更新
df=df.sort_values(['LeadID','LeadStatus','Duration']) df.loc[df[df.duplicated(['LeadID','LeadStatus'],keep='last')].index,'Target']=1 Out[911]: LeadID LeadStatus Duration Target 0 1-1H9C0XL TooSmall -0.466 1 1 1-1H9G33C A -0.621 1 2 1-1H9G33C A -0.501 1 3 1-1H9G33C A 0.337 0 4 4-1HFORF8 NoFit -0.344 1 5 4-1HFSXOG NoFit -0.125 1 8 4-1HLQ2IJ A -0.401 1 6 4-1HLQ2IJ A -0.331 1 7 4-1HLQ2IJ A 0.131 1 9 4-1HLQ2IJ A 0.241 0

相关问题更多 >

编程相关推荐

热门问题

热门文章