Python用惟一的值指出两列之间的差异

网友

1楼 · 编辑于 2024-04-26 07:40:46

将.groupby()与.nunique()一起使用：

df.groupby('column_1_name')['column_2_name'].nunique()

网友

2楼 · 编辑于 2024-04-26 07:40:46

您可以读取没有列名的CSV文件，并可以获得如下值

df = pd.read_csv('data.csv',header=None)
print(df.groupby(0)[1].nunique()==1)

结果：

Ball      True
Stick    False

网友

3楼 · 编辑于 2024-04-26 07:40:46

df.duplicated(subset='Ball')

这将返回一系列布尔值，指示值是否与前一行重复

   Ball Stick
0   1   2
1   1   3

退货

0    False
1     True
dtype: bool

编辑：

所以我想我知道行动的方向

如果我用以下设置df：

df = pd.DataFrame([['1','2'],['1','2'],['1','8']], columns=['Ball','Stick'])

数据框返回

   Ball Stick
0   1   2
1   1   2
2   1   8

然后：

for row in df:
    print(row)
    print(df.duplicated(subset=row, keep=False))

退货：

Ball
0    True
1    True
2    True
dtype: bool
Stick
0     True
1     True
2    False
dtype: bool

所以任何一列中有False的都是“坏的”