如何在Pandas中使用.isin和groupby

2024-05-29 10:05:33 发布

您现在位置:Python中文网/ 问答频道 /正文

P_id   F_name      L_name     DOB        dup_id
25     John        Doe        23/1/90     29  
28     John        Doe        23/1/90     29  
29     John        Doe        23/1/90     0  
35     Jane        Dawson     20/1/68     0  
47   Jane Matilda  Dawson     20/1/68     35
120    Shane         Jack     12/1/97     0
50     Belinda     Ada        11/11/11    145  
145    Belynda     Ada        11/11/11    0
65     Shayne M.   Jack       12/1/97     120

我正在尝试检查是否在p_id中找到dup_id,然后将dup_id和“p_id”行组合在一起。通过给每个组分配唯一的“否”将它们分组。在

for ind, val in df[p_id'].iteritems(): if val in df['dup_id']: df5 = df.assign(id=(df['F_name'] + '_' + df['L_name']).astype('category').cat.codes)

上面的代码不起作用,这只是我的尝试。 这个表是用p_id链接到数据库中的其他表的,我需要合并或联接它们

uid(新id)和将用于对记录进行分组。我会按fname和lname对它们进行分组,但是由于名称条目不一致,我决定使用dup_id和p_id,这两个id更可靠

新输出

^{pr2}$

Tags: nameiniddfvaljohnjackdoe

热门问题