“值错误：无法从重复轴重新索引”

Timestamp A B C ... 2014-11-09 00:00:00 NaN 1 NaN NaN 2014-11-09 00:00:00 2 NaN NaN NaN 2014-11-09 00:00:00 NaN NaN 3 NaN 2014-11-09 08:24:00 NaN NaN 1 NaN 2014-11-09 08:24:00 105 NaN NaN NaN 2014-11-09 09:19:00 NaN NaN 23 NaN

Timestamp A B C ... 2014-11-09 00:00:00 2 1 3 NaN 2014-11-09 00:01:00 NaN NaN NaN NaN 2014-11-09 00:02:00 NaN NaN NaN NaN ... NaN NaN NaN NaN 2014-11-09 08:23:00 NaN NaN NaN NaN 2014-11-09 08:24:00 105 NaN 1 NaN 2014-11-09 08:25:00 NaN NaN NaN NaN 2014-11-09 08:26:00 NaN NaN NaN NaN 2014-11-09 08:27:00 NaN NaN NaN NaN ... NaN NaN NaN NaN 2014-11-09 09:18:00 NaN NaN NaN NaN 2014-11-09 09:19:00 NaN NaN 23 NaN

1条回答

网友

1楼 · 发布于 2024-05-14 20:32:15

假设您的Timestamp作为索引开始，您需要先执行重新采样，然后在执行groupby之前，这里是工作示例：

import pandas as pd

df
                       A   B   C  ...
Timestamp                            
2014-11-09 00:00:00  NaN   1 NaN  NaN
2014-11-09 00:00:00    2 NaN NaN  NaN
2014-11-09 00:00:00  NaN NaN   3  NaN
2014-11-09 08:24:00  NaN NaN   1  NaN
2014-11-09 08:24:00  105 NaN NaN  NaN
2014-11-09 09:19:00  NaN NaN  23  NaN

df.resample('1Min', how='max').reset_index().groupby('Timestamp').sum()

                      A   B   C  ...
Timestamp                           
2014-11-09 00:00:00   2   1   3  NaN
2014-11-09 00:01:00 NaN NaN NaN  NaN
2014-11-09 00:02:00 NaN NaN NaN  NaN
2014-11-09 00:03:00 NaN NaN NaN  NaN
2014-11-09 00:04:00 NaN NaN NaN  NaN
...
2014-11-09 09:17:00 NaN NaN NaN  NaN
2014-11-09 09:18:00 NaN NaN NaN  NaN
2014-11-09 09:19:00 NaN NaN  23  NaN

希望这有帮助。

更新时间：

如注释中所述，您的“Timestamp”不是datetime，可能是string，因此您不能按datetime index重新采样，只需重置索引并将其转换为如下内容：

df = df.reset_index()
df['ts'] = pd.to_datetime(df['Timestamp'])
# 'ts' is now datetime of 'Timestamp', you just need to set it to index
df = df.set_index('ts')
...

现在只需再次运行前面的代码，但将“Timestamp”替换为“ts”，就可以了。

更新时间：

相关问题更多 >

编程相关推荐

热门问题

热门文章