我知道,迭代在熊猫身上是“不可接受的”,有很多更有效的方法可以做到这一点,但为了更好地理解,让我们坚持迭代
我有一个巨大的NetFlow数据库(它包含时间戳、源ip、目标ip、协议、源和目标保护以及更多属性)。
我想基于前面的行创建自定义属性
基本上,我想“迭代”整个数据帧,对于每一行,我想得到源IP,然后向后“迭代”一个小时。在这一小时内,我希望获得与所选源IP匹配的所有行,并且仅使用这些行,我希望从过去一小时内以前出现的每个源IP的最后两个属性计算新属性
One row from the dataset
Tags:
您可以在不进行“迭代”的情况下实现这一点,您可以对数据帧应用lambda函数,只需使用索引来实现“向后”逻辑。您不会理解使用迭代,您可以理解使用df.apply()做得更好
相关问题 更多 >
编程相关推荐