我要做的是保持所有行都具有相同的唯一性ID
,如果其中任何一行在Yurt列中只包含两个“–”实例。你知道吗
我正在考虑通过执行以下操作来使用str.contains
和布尔掩码:
df[df['ID'].isin(df.loc[df.Yurt.str.contains('-'), 'ID'].unique())]
…但不确定如何只保留只有两个实例的行,而没有值。你知道吗
示例df:
ID % Yurt
abc123 0.833 Bodega
abc123 0.87 -
abc123 0.867 -
abc123 0.812 -
lmn789 0.837 Mickey's
lmn789 0.856 Chopped Cheese
lmn789 0.813 -
lmn789 0.812 -
xyz456 0.111 -
xyz456 0.222 -
xyz456 0.333 -
xyz456 0.444 -
结果数据框:
ID % Yurt
lmn789 0.837 Mickey's
lmn789 0.856 Chopped Cheese
lmn789 0.813 -
lmn789 0.812 -
对“ID”列执行} :
groupby
,然后使用^{输出:
您可以使用
GroupBy.size
来计算范围内的值。然后过滤原始数据帧。你知道吗您可能会发现这比自定义
lambda
函数更有效:相关问题 更多 >
编程相关推荐