给定一个pandas
dataframe
,看起来如下column_a
和column_b
。如何构造两个附加列,一个计算所有列的column_a
中每个值的频率,另一个计算column_a
中值相同的唯一值数:
column_a | column_b | col_a_count | count_unique_b_where_a
0 1 4 3
0 1 4 3
0 2 4 3
0 3 4 3
2 0 3 1
2 0 3 1
2 0 3 1
5 3 1 1
9 5 6 5
9 5 6 5
9 3 6 5
9 4 6 5
9 2 6 5
9 1 6 5
使用
groupby
和agg
:相关问题 更多 >
编程相关推荐