“向后迭代”数据帧中的大型数据集

2024-05-20 07:16:12 发布

您现在位置:Python中文网/ 问答频道 /正文

我知道,迭代在熊猫身上是“不可接受的”,有很多更有效的方法可以做到这一点,但为了更好地理解,让我们坚持迭代

我有一个巨大的NetFlow数据库(它包含时间戳、源ip、目标ip、协议、源和目标保护以及更多属性)。 我想基于前面的行创建自定义属性

基本上,我想“迭代”整个数据帧,对于每一行,我想得到源IP,然后向后“迭代”一个小时。在这一小时内,我希望获得与所选源IP匹配的所有行,并且仅使用这些行,我希望从过去一小时内以前出现的每个源IP的最后两个属性计算新属性

One row from the dataset


Tags: 数据方法fromip数据库协议目标属性
1条回答
网友
1楼 · 发布于 2024-05-20 07:16:12

您可以在不进行“迭代”的情况下实现这一点,您可以对数据帧应用lambda函数,只需使用索引来实现“向后”逻辑。您不会理解使用迭代,您可以理解使用df.apply()做得更好

相关问题 更多 >