dataframe groupby中的计数特定字段

2024-06-12 04:30:15 发布

您现在位置:Python中文网/ 问答频道 /正文

我是Python新手,试图了解如何操作数据帧。我正在使用winemag-data-130k-v2.csv数据集。 感兴趣的领域有“国家”、“省”、“酿酒厂”、“品种”

我想做的第一件事是确定每个省份的酿酒厂数量。 我可以走到最远的地方 reviews_df.groupby(['country','province']).size()

但这给了我行数(因此,如果一个酒厂生产3个品种,则为3)。 但是我想要SQL中的count(distinct winery)之类的东西。 建议


Tags: csv数据data数量地方国家感兴趣领域