两个分类变量的描述性统计(Pandas)

2024-06-16 12:19:44 发布

您现在位置:Python中文网/ 问答频道 /正文

我需要得到两个分类变量之间频率的平均值和中位数。E、 g.:

标签字母编号
Foo | A | 1
Foo | B | 2
Foo | C | 4
Bar | A | 2
巴|克| 3
巴| N | 1
巴| P | 2
Cee | B | 1
Cee | B | 2
Cee | C | 4
Cee | D | 5

例如,每个标签的平均和中间字母数是多少。三种可能的标签中有11种(M=3.667),中位数为4(3foo,4bar,4cee)。在熊猫身上怎么计算呢。有没有可能用groupby语句执行此操作?我的数据集比这个大得多。在


Tags: 数据foo字母分类bar标签语句编号
1条回答
网友
1楼 · 发布于 2024-06-16 12:19:44

一列需要^{}^{}+^{}(或{a4},如果需要省略NaNs):

a = df['Label'].value_counts()
print (a)
Cee    4
Bar    4
Foo    3
Name: Label, dtype: int64

#alternative
#a = df.groupby('Label').size()
print (a.mean())
3.6666666666666665

print (a.median())
4.0

^{pr2}$

相关问题 更多 >