假设我有以下数据:
>>> data = {'event': [0,1,1,2,1,0],
... 'val1': [1, 2, 3, 4, 5, 6]
... }
>>> df1 = pd.DataFrame(data, index = ['hash1', 'hash1', 'hash2',
'hash3', 'hash3', 'hash3'])
>>> df1
event val1
hash1 0 1
hash1 1 2
hash2 1 3
hash3 2 4
hash3 1 5
hash3 0 6
我想做的是: 我想减少df,以便只显示有关这些哈希的数据,这些哈希至少有一个事件的all唯一值。你知道吗
所以最后我会得到这样一个数据帧:
event val1
hash3 2 4
hash3 1 5
hash3 0 6
我试着将数据帧拆分为等于零或大于零的事件,然后在“不等于零”的数据帧中从“等于零”的数据帧中查找索引-但我对pandas真的很不好。如果有人能帮我做到这一点,我将非常感激。 提前谢谢各位!你知道吗
您可以在索引上的
groupby
之前过滤df,然后使用nunique
获取唯一事件的数量,并在具有多个唯一项的哈希上过滤原始df:分解以上内容:
编辑
根据您的更新,您可以将
nunique
值的长度与事件的unique
值的长度进行比较:相关问题 更多 >
编程相关推荐