如何检查列中的值是否存在于下一行中？

网友

1楼 · 编辑于 2024-05-23 18:27:54

下面将检查下一行中的值（对于数字和日期时间数据类型）是否相同？你知道吗

In [203]: df.AutoStudyID.diff() == 0
Out[203]:
0    False
1     True
2    False
Name: AutoStudyID, dtype: bool

In [204]: df[df.AutoStudyID.diff() == 0]
Out[204]:
   AutoStudyID    DiagDate DiagName
1           34  2001-01-01     Skin

或者更一般的方法（它也适用于strings）：

In [206]: df.AutoStudyID.shift() == df.AutoStudyID
Out[206]:
0    False
1     True
2    False
Name: AutoStudyID, dtype: bool

网友

2楼 · 编辑于 2024-05-23 18:27:54

用iterrows()遍历行，并将字段AutoStudyID与最后找到的值进行比较。你知道吗

last = None
for i, row in df.iterrows():
    if last == df['AutoStudyID'][i]:
        print('I found it in position: %s' % i)
    else:
        last = df['AutoStudyID'][i]

网友

3楼 · 编辑于 2024-05-23 18:27:54

尝试添加具有以下AutoStudio ID的新列：

df['next'] = df.AutoStudyID.shift(-1)
df

    AutoStudyID DiagDate    DiagName    next
0   34          2010-09-23  Lung        34
1   34          2001-01-01  Skin        48
2   48          2008-01-01  Brain       NaN

每一行都会有下一个的id。行应按AutoStudyID排序。你知道吗

您也可以尝试按AutoStudio ID分组：

df.groupby('AutoStudyID')

例如：

for group in df.groupby('AutoStudyID'):
    print(group)

有了这些小组，你就可以做你需要的事：

('34',   AutoStudyID    DiagDate DiagName next
0          34  2010-09-23     Lung   34
1          34  2001-01-01     Skin   48)
('48',   AutoStudyID    DiagDate DiagName next
2          48  2008-01-01    Brain  NaN)

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何检查列中的值是否存在于下一行中？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >