我试着分词,然后用Python数数。你知道吗
原始数据是这样的
col_A
happy, not happy
sad,happy
sad, happy
angry, happy
angry, sad
我试着用这个函数来计算A列中的单词
word_list= df.col_A.apply(lambda x: pd.value_counts(x.split(","))).sum(axis=0)
word_list.sort_values(ascending = False)
它会给我这样的结果
angry 2
happy 2
sad 2
happy 2
not happy 1
sad 1
如何避免这些空格来返回值的实际计数?你知道吗
我想返回一个列表,比如
happy 4
sad 3
angry 2
not happy 1
这里有一个非常类似于@anky\u 91的解决方案:
让我们将
melt
或stack
与str.split
和value_counts
一起使用:或者
输出:
一个班轮,不能保证效率,但它的工作:)
输出:
效率测试:
相关问题 更多 >
编程相关推荐