如何用多准则分割Pandas数据帧

2024-05-16 10:30:13 发布

您现在位置:Python中文网/ 问答频道 /正文

我有约150000行的数据详细说明电子邮件弹跳按域,电子邮件模板,弹跳类型和每天计数。格式如下:

+--------+-------------+-----------------+-------+---------+-------+
|   t    | bounce_type |    source_ip    |  tid  |  emld   | count |
+--------+-------------+-----------------+-------+---------+-------+
| 1/1/15 | hard        | 199.122.255.142 | 10033 | aol.com |     4 |
+--------+-------------+-----------------+-------+---------+-------+

仅选择emld为“”的行的最简单方法是什么美国在线,反弹类型为“硬”,来自所有源IP和所有TID?这是我要为其创建一个函数并传递dataframe的东西,还是有一个更简单的操作来根据这些条件过滤数据?你知道吗


Tags: 数据ip模板类型source电子邮件格式type
1条回答
网友
1楼 · 发布于 2024-05-16 10:30:13

一个简单的方法是执行一个被掩蔽的,假设您的数据帧名为df,它是这样的:

masked = (df['emld'] == 'aol.com') & (df['bounce_type'] == 'hard')
# then the result will be
df[masked]

一行中的速记版本:

df[(df['emld'] == 'aol.com') & (df['bounce_type'] == 'hard')]

只返回source_iptids列:

df[masked][['source_ip', 'tids']]

或者

df[(df['emld'] == 'aol.com') & (df['bounce_type'] == 'hard')][['source_ip', 'tids']]

希望这有帮助。你知道吗

相关问题 更多 >