如何获取数据帧列值的平均值

2024-06-16 11:23:48 发布

您现在位置:Python中文网/ 问答频道 /正文

                    A        B
DATE                 
2013-05-01        473077    71333
2013-05-02         35131    62441
2013-05-03           727    27381
2013-05-04           481     1206
2013-05-05           226     1733
2013-05-06           NaN     4064
2013-05-07           NaN    41151
2013-05-08           NaN     8144
2013-05-09           NaN       23
2013-05-10           NaN       10

假设我有上面的数据框。获取具有相同索引(即列a和列B的平均值)的序列的最简单方法是什么?平均值需要忽略NaN值。关键在于,这个解决方案需要灵活地向数据框架中添加新列。

我最近来的是

df.sum(axis=1) / len(df.columns)

然而,这似乎并没有忽略NaN值

(注:我对熊猫图书馆还是有点陌生,所以我想有一个明显的方法可以做到这一点,那就是我有限的大脑根本看不见)


Tags: columns数据方法框架dfdatelen序列
1条回答
网友
1楼 · 发布于 2024-06-16 11:23:48

简单地使用df.mean()将对NaNs做正确的事情(tm):

>>> df
                 A      B
DATE                     
2013-05-01  473077  71333
2013-05-02   35131  62441
2013-05-03     727  27381
2013-05-04     481   1206
2013-05-05     226   1733
2013-05-06     NaN   4064
2013-05-07     NaN  41151
2013-05-08     NaN   8144
2013-05-09     NaN     23
2013-05-10     NaN     10
>>> df.mean(axis=1)
DATE
2013-05-01    272205.0
2013-05-02     48786.0
2013-05-03     14054.0
2013-05-04       843.5
2013-05-05       979.5
2013-05-06      4064.0
2013-05-07     41151.0
2013-05-08      8144.0
2013-05-09        23.0
2013-05-10        10.0
dtype: float64

如果还有其他列要忽略,可以使用df[["A", "B"]].mean(axis=1)

相关问题 更多 >