“合并”列表中元素上的2个数据帧？双键

df8=pd.DataFrame({'Dates':['2017-12-14', '2017-12-14','2017-12-16'],'names':[['Hans','Meier'],['Debby','Harry'],['Hans','Harry']]}) df9=pd.DataFrame({'Date':['2017-12-14','2017-12-14','2017-12-14','2017-12-14','2017-12-14','2017-12-16','2017-12-16'],'caller':['Hans','Meier','Debby','Harry','Peter','Hans','Harry'],'text':[['hi im hans'],['hi im meier'],['hi im debby'],['hi im harry'],['hi im peter'],['my name is hans'],['my name is harry']]}) df9.set_index(df9.Date, inplace = True) df9.drop('Date', axis = 1, inplace = True) df9.head(10) Date names text 2017-12-14 Hans [hi im hans] 2017-12-14 Meier [hi im meier] 2017-12-14 Debby [hi im debby] 2017-12-14 Harry [hi im harry] 2017-12-14 Peter [hi im peter] 2017-12-16 Hans [my name is hans] 2017-12-16 Harry [my name is harry]

Date names content 2017-12-14 ['Hans','Meier'] ['hi im hans', 'hi im meier'] 2017-12-14 ['Debby','Harry',] ['hi im debby', 'hi im harry',] 2017-12-16 ['Hans', 'Harry'] ['my name is hans','my name is harry']

1条回答

网友

1楼 · 发布于 2024-05-15 11:02:00

IIUC，你可以这样做：

展平df8并分配给m

m=pd.DataFrame({'Dates':df8.loc[df8.index.repeat(df8.names.str.len()),'Dates'],
         'names':np.concatenate(df8.names)})

然后，merge和groupby：

(m.merge(df9,left_on=['Dates','names'],right_on=['Date','caller']).
groupby('Dates')['text'].apply(sum).reset_index())

        Dates                                 text
0  2017-12-14            [hi im hans, hi im meier]
1  2017-12-15           [hi im debby, hi im harry]
2  2017-12-16  [my name is hans, my name is harry]

相关问题更多 >

编程相关推荐

热门问题

热门文章