A B
DATE
2013-05-01 473077 71333
2013-05-02 35131 62441
2013-05-03 727 27381
2013-05-04 481 1206
2013-05-05 226 1733
2013-05-06 NaN 4064
2013-05-07 NaN 41151
2013-05-08 NaN 8144
2013-05-09 NaN 23
2013-05-10 NaN 10
假设我有上面的数据框。获取具有相同索引(即列a和列B的平均值)的序列的最简单方法是什么?平均值需要忽略NaN值。关键在于,这个解决方案需要灵活地向数据框架中添加新列。
我最近来的是
df.sum(axis=1) / len(df.columns)
然而,这似乎并没有忽略NaN值
(注:我对熊猫图书馆还是有点陌生,所以我想有一个明显的方法可以做到这一点,那就是我有限的大脑根本看不见)
简单地使用
df.mean()
将对NaNs做正确的事情(tm):如果还有其他列要忽略,可以使用
df[["A", "B"]].mean(axis=1)
。相关问题 更多 >
编程相关推荐