如何删除3列以上具有相同值的行

网友

1楼 · 编辑于 2024-04-16 09:25:51

可以使用只有唯一值的集合。如果一行有3个相等的值，那么 len（set（row））=len（row）-2。遍历数据帧以查找这些行并存储它们的索引。你知道吗

indexes_to_remove = []
for index, row in df.iterrows():
    if len(set(row)) < len(row) - 2:
        indexes_to_remove.append(index)

然后你就可以安全地移除它们了。你知道吗

网友

2楼 · 编辑于 2024-04-16 09:25:51

下面是一个通过^{}和^{}的天真熊猫循环：

def max_count(s):
    return s.value_counts().values[0]

res = df[df.apply(max_count, axis=1).le(3)]

print(res)

   A  B  C  D  E  F  G
0  1  4  9  4  6  9  8
3  2  6  9  5  4  4  5
4  2  8  1  9  5  8  9
5  2  2  2  5  6  3  6

网友

3楼 · 编辑于 2024-04-16 09:25:51

进近#1

对于带有ints的数据帧，这里有一个带有bincount的矢量化数据帧-

# https://stackoverflow.com/a/46256361/ @Divakar
def bincount2D_vectorized(a):    
    N = a.max()+1
    a_offs = a + np.arange(a.shape[0])[:,None]*N
    return np.bincount(a_offs.ravel(), minlength=a.shape[0]*N).reshape(-1,N)

out = df[(bincount2D_vectorized(df.values)<=3).all(1)]

样本输出-

In [563]: df[(bincount2D_vectorized(df.values)<=3).all(1)]
Out[563]: 
   A  B  C  D  E  F  G
0  1  4  9  4  6  9  8
3  2  6  9  5  4  4  5
4  2  8  1  9  5  8  9
5  2  2  2  5  6  3  6

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何删除3列以上具有相同值的行

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >