如何在一个数据帧中发现两个实体是否在同一个组中？

网友

1楼 · 编辑于 2024-06-17 08:00:11

试试这个：

def bothInCity(df, n1, n2):
    s = {n1, n2}
    c = df.groupby('City').Name.apply(set)
    chk = lambda x: s.issubset(x)
    return c.loc[c.apply(chk)]

然后像这样使用：

bothInCity(df, 'Bob', 'Alice')

City
Seattle    {Bob, Alice}
Name: Name, dtype: object

网友

2楼 · 编辑于 2024-06-17 08:00:11

您可以使用：

names = ['Alice', 'Bob']
df[df.Name.isin(names)].groupby('City').Name.nunique() > 1

收益率

City
Portland    False
Seattle      True
Name: Name, dtype: bool

用(..).any()括起来以获得摘要True/False结果。你知道吗

如果一个人可以在同一个City中多次出现，您可以先使用.drop_duplicates(['Name', 'City')。你知道吗

包装在函数中：

def same_city(df, n1, n2):
    same = df[df.Name.isin(names)].groupby('City').Name.nunique() > 1
    return same, same.any()

result, summary = same_city(df, 'Alice', 'Bob')

收益率：

City
Portland    False
Seattle      True
Name: Name, dtype: bool
True

网友

3楼 · 编辑于 2024-06-17 08:00:11

使用groupby的一种可能方法：

x = "Mallory"
y = "Alice"
any(any(names[1].str.contains(x)) and any(names[1].str.contains(y)) for names in df.groupby('City').Name)

# False

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何在一个数据帧中发现两个实体是否在同一个组中？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >