P_id F_name L_name DOB dup_id
25 John Doe 23/1/90 29
28 John Doe 23/1/90 29
29 John Doe 23/1/90 0
35 Jane Dawson 20/1/68 0
47 Jane Matilda Dawson 20/1/68 35
120 Shane Jack 12/1/97 0
50 Belinda Ada 11/11/11 145
145 Belynda Ada 11/11/11 0
65 Shayne M. Jack 12/1/97 120
我正在尝试检查是否在p_id中找到dup_id,然后将dup_id和“p_id”行组合在一起。通过给每个组分配唯一的“否”将它们分组。在
for ind, val in df[p_id'].iteritems():
if val in df['dup_id']:
df5 = df.assign(id=(df['F_name'] + '_' + df['L_name']).astype('category').cat.codes)
上面的代码不起作用,这只是我的尝试。 这个表是用p_id链接到数据库中的其他表的,我需要合并或联接它们
uid(新id)和将用于对记录进行分组。我会按fname和lname对它们进行分组,但是由于名称条目不一致,我决定使用dup_id和p_id,这两个id更可靠
新输出
^{pr2}$
目前没有回答
相关问题 更多 >
编程相关推荐