将标识符中的值串联起来

2024-04-20 14:06:38 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图在pandas中创建一个全面的数据框架,基于围绕标识符构建的数据。你知道吗

我的输入数据帧:

>>> data = [['x', '34H52'], ['x', '38B55'], ['y',  '34H52'], ['y', '38B55'], ['z', '38B55'], ['z', '38B55']]                                                        
>>> df = pd.DataFrame(data, columns=['identifier', 'data'])                    
>>> df                                                                      
  identifier   data
0          x  34H52
1          x  38B55
2          y  34H52
3          y  38B55
4          z  38B55
5          z  38B55

我需要用标识符连接这些值。你知道吗

我想要的输出:

  identifier         data
0          x  34H52,38B55
1          y  34H52,38B55
2          z  38B55,38B55

我对熊猫不是很有经验,所以我想知道这是否可以直接和熊猫一起做,如果可以,怎么做?你知道吗


Tags: columns数据框架dataframepandasdfdata标识符
1条回答
网友
1楼 · 发布于 2024-04-20 14:06:38

给予

>>> df                                                                      
  identifier   data
0          x  34H52
1          x  38B55
2          y  34H52
3          y  38B55
4          z  38B55
5          z  38B55

您可以按标识符分组,然后在聚合步骤中应用str.join。你知道吗

>>> df.groupby('identifier', as_index=False).agg(lambda s: ','.join(s))     
   identifier        data
0          x  34H52,38B55
1          y  34H52,38B55
2          z  38B55,38B55

相关问题 更多 >