通过只让每个oth之间相隔一个月的行来过滤数据帧

Date Latitude Longitude Disaster 2011-01-10 56.79 89.90 Cyclone 2011-02-09 45.01 79.24 Cyclone 2010-11-20 34.08 69.92 Cyclone 2010-12-19 66.78 125.35 Cyclone 2017-09-10 56.99 98.22 Cyclone

1条回答

网友
1楼 · 发布于 2024-04-28 20:46:44

如果你有记忆，merge与自己，然后过滤合并后，只有那些气旋发生在1个月内。使用pd.offsets.DateOffset获得与relativedelta相同的逻辑
import pandas as pd df['Date'] = pd.to_datetime(df.Date) df = df[df.Disaster=='Cyclone'].reset_index() # Need index to deduplicate later merged = df.merge(df, on='Disaster', suffixes=['_1', '_2']) mask = ((merged.index_1 > merged.index_2) # Remove self merges and AB-BA duplicates & merged.Date_1.between(merged.Date_2 - pd.offsets.DateOffset(months=1), merged.Date_2 + pd.offsets.DateOffset(months=1))) merged = merged[mask].drop(columns=['index_1', 'index_2'])
输出：merged
Date_1 Latitude_1 Longitude_1 Disaster Date_2 Latitude_2 Longitude_2 5 2011-02-09 45.01 79.24 Cyclone 2011-01-10 56.79 89.90 15 2010-12-19 66.78 125.35 Cyclone 2011-01-10 56.79 89.90 17 2010-12-19 66.78 125.35 Cyclone 2010-11-20 34.08 69.92
如果您真的只需要原始数据帧中的行，并且这些对是无用的，那么不要删除['index_1', 'index_2']，并使用唯一值来子集原始的DataFrame，或者使用pd.wide_to_longon merged+drop_duplicates将其格式化为原始的样子。你知道吗

输出：`merged`

相关问题更多 >

编程相关推荐

热门问题

热门文章