在定义的条件下使用值_counts（）

2条回答

网友

1楼 · 编辑于 2024-04-20 10:21:41

逻辑是，您可以使用相同大小的布尔序列对序列进行切片：

s[bool_series]

或同等地

s.loc[bool_series]

现在，您的代码相当于：

s = df['veh'].value_counts()

bool_series = s > 2

然后是前两行中的任何一行，例如s[s>2]

网友

2楼 · 编辑于 2024-04-20 10:21:41

下面的代码行

df['veh'].value_counts()

返回一个系列，其中键作为索引，出现次数作为值

方括号[]之间的所有内容都是熊猫系列关键帧上的过滤器。所以

df['veh'].value_counts()['car']

应返回“veh”列中“car”一词的出现次数。这相当于系列df['veh'].value_counts()上键“car”的对应值

熊猫系列也接受键列表作为索引，所以

df['veh'].value_counts()[['car','boat']]

应分别返回单词“car”和“boat”的出现次数

此外，如果布尔值列表与序列长度相同，则序列接受布尔值列表作为键。也就是说，它接受一个布尔掩码

当你写作时

df['veh'].value_counts() > 2

将df['veh'].value_counts()上的每个值与数字2进行比较。这将为每个值返回一个布尔值，即布尔掩码

因此，可以将布尔掩码用作所创建序列的过滤器。因此

df['veh'].value_counts()[df['veh'].value_counts() > 2]

返回出现次数大于2的关键点的所有出现次数