Pandas或Numpy：如何获得匹配的数据条目来进行数据操作

1条回答

网友

1楼 · 发布于 2024-04-26 06:49:28

一种方法是使用`merge`和`groupby`:

data1.merge(data2, left_on='C2', right_on='C3', how='left')[['C1', 'C4']]\
     .fillna(0)\
     .groupby('C1')\
     .sum()

输出：

        C1   C4
0    "Joe"  8.0
1   "John"  7.0
2  "Peter"  0.0
3  "Susan"  0.0

要获取字典输出：

data1.merge(data2, left_on='C2', right_on='C3', how='left')[['C1', 'C4']]\
     .fillna(0)\
     .groupby('C1')\
     .sum()\
     .T\
     .to_dict('r')

输出：

[{'"Joe"': 8.0, '"John"': 7.0, '"Peter"': 0.0, '"Susan"': 0.0}]

另一种方法是将`map`与`sum`:

data1['Score'] = data1['C2'].map(data2.set_index('C3', append=True)\
                            .sum(level=1)['C4']).fillna(0)
data1[['C1', 'Score']]

输出：

        C1  Score
0  "Peter"    0.0
1   "John"    7.0
2  "Susan"    0.0
3    "Joe"    8.0

附加评论：

data1.merge(data2.rename_axis('d2_idx').reset_index(), left_on='C2', right_on='C3', how='left')\
     .groupby('C1')['d2_idx','C4']\
     .agg({'d2_idx':lambda x: ', '.join(x.astype(str)), 'C4':'sum'})

输出：

           d2_idx   C4
C1                    
"Joe"    0.0, 2.0  8.0
"John"        1.0  7.0
"Peter"       nan  0.0
"Susan"       nan  0.0

一种方法是使用`merge`和`groupby`:

另一种方法是将`map`与`sum`:

附加评论：

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas或Numpy：如何获得匹配的数据条目来进行数据操作

一种方法是使用merge和groupby:

另一种方法是将map与sum:

附加评论：

相关问题 更多 >

编程相关推荐

热门问题

热门文章

一种方法是使用`merge`和`groupby`:

另一种方法是将`map`与`sum`:

相关问题更多 >