我有一个pandas.DataFrame
,有两列,其中包括酒精种类(即伏特加80伏特加、加拿大威士忌、香料朗姆酒)和售出的酒瓶数量。我想先把它分为粒度较小的类别,即威士忌、伏特加、朗姆酒,然后再把每一类售出的所有瓶子加起来。在
我的代码不允许我隔离标签,如“伏特加”,而是返回类别的频率,如“伏特加80证明”。在
top_N = 10 # top 10 most used categories
word_dist = nltk.FreqDist(df['Category Name'])
print('All frequencies:')
print('=' * 60)
rslt = pd.DataFrame(word_dist.most_common(top_N),
columns=['Word', 'Frequency'])
print(rslt)
print('=' * 60)
df= df.groupby('Category Name')['Bottles Sold'].sum()
有什么想法吗?在
你考虑过添加匹配词的类别吗?比如:
代码:
测试代码:
^{pr2}$结果:
谢谢你的意见,斯蒂芬!在
我做了一点小小的修改,因为你的回答返回了一个键错误。 以下是我的修改:
相关问题 更多 >
编程相关推荐