如何根据条件选择数据帧中的行

2024-04-19 16:52:44 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个emails数据框,在其中我给出了这个查询:

williams = emails[emails["employee"] == "kean-s"]

这将选择包含employee kean-s的所有行。然后我数了数频率,打印出最上面的。事情就是这样的:

williams["X-Folder"].value_counts()[:10]

输出如下:

attachments                   2026
california                     682
heat wave                      244
ferc                           188
pr-crisis management            92
federal legislation             88
rto                             78
india                           75
california - working group      72
environmental issues            71

现在,我需要打印所有的行从电子邮件有X_文件夹列等于附件,加利福尼亚州,热路等。我该怎么做呢?当我打印值[0]时,它只返回频率数字,而不是与之对应的术语(尝试打印它是因为如果我能够循环遍历它,我只会在数据帧中放入一个条件)


Tags: 数据valueemployeefolderwave事情attachments频率
1条回答
网友
1楼 · 发布于 2024-04-19 16:52:44

使用^{}^{}作为索引值:

df = williams[williams["X-Folder"].isin(williams["X-Folder"].value_counts()[:10].index)]

或:

df = williams[williams["X-Folder"].isin(williams["X-Folder"].value_counts().index[:10])]

如果需要筛选原始DataFrame中的所有行(也包括不匹配kean-s的行),则使用:

df1 = emails[emails["X-Folder"].isin(williams["X-Folder"].value_counts().index[:10])]

相关问题 更多 >