基于分类列中dinstict值的计数，从dataframe中删除所有行

2条回答

网友

1楼 · 编辑于 2024-06-16 09:38:44

这里有一种方法使用值计数结果上的loc来过滤那些超过最小计数值的制造商

# Sample data.
df = pd.DataFrame(
    {'manufacturer': 
        ['VW'] * 2228 
        + ['Opel'] * 1414 
        + ['Renault'] * 1362
        + ['Audi'] * 895
        + ['BMW'] * 888
        + ['Mercedes-Benz'] * 787}
)

解决方案：

min_count = 1000
main_manufacturers = set(
    df['manufacturer'].value_counts(sort=False).loc[lambda x: x >= min_count].index)
df = df.loc[df['manufacturer'].isin(main_manufacturers)]

网友

2楼 · 编辑于 2024-06-16 09:38:44

你可以做一个地图：

# get the count for each manufacturer
counts = carsDF.manufacturer.value_counts()

# threshold
thresh = 1000

# replace the manufacturer with the counts and thresholding
carsDF[carsDF.manufacturer.map(counts).ge(thresh)]

编程相关推荐

java如何运行一个在播放歌曲的同时创建和更改UI的方法？
eclipse错误：无法找到或加载主类Java，因为类文件anme和类名不同？
两个数字相加得到一个值的java算法
java我可以更改字符串吗？
java Hibernate 5.2：以编程方式从其他jar加载映射
java如何访问随机跳转到固定位置的二进制文件
java是解析器实现中文档的功能
Javasocket的两端齐平
java查找将两个非常大的整数之和除以相等块的步骤
java如何在Restlet中调用带超时的异步HTTP客户端

相关问题更多 >

编程相关推荐

热门问题

热门文章

基于分类列中dinstict值的计数，从dataframe中删除所有行

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >