如果我有这样的桌子:
df = pd.DataFrame({
'hID': [101, 102, 103, 101, 102, 104, 105, 101],
'dID': [10, 11, 12, 10, 11, 10, 12, 10],
'uID': ['James', 'Henry', 'Abe', 'James', 'Henry', 'Brian', 'Claude', 'James'],
'mID': ['A', 'B', 'A', 'B', 'A', 'A', 'A', 'C']
})
我可以在Qlik中为唯一hID计算5。如何在python中使用pandas数据帧来实现这一点?或者一个核阵列?类似地,如果要做count(hID)
,我将在Qlik中得到8。在大熊猫身上做这件事的等效方法是什么?
或获取每列的唯一值的数目:
在} 中新建
pandas 0.20.0
^{你总是能够在一个
groupby
中做一个agg
。我在最后使用了stack
,因为我更喜欢这个演示。如果我假设data是数据帧的名称,则可以执行以下操作:
这将显示不同的元素及其出现次数。
计算距离值,使用
nunique
:仅计数非空值,使用
count
:计算包含空值的总值,使用
size
属性:编辑以添加条件
使用布尔索引:
或者使用
query
:输出:
相关问题 更多 >
编程相关推荐