我有一个如下所示的数据帧
Utterance Frequency
Directions to Starbucks 1045
Show me directions to Starbucks 754
Give me directions to Starbucks 612
Navigate me to Starbucks 498
Display navigation to Starbucks 376
Direct me to Starbucks 201
Navigate to Starbucks 180
这里,有一些数据显示了人们的话语,以及这些话语的频率。你知道吗
例如,“星巴克方向”被说了1045次,“给我看星巴克方向”被说了754次,等等
我想知道每个单词被说出多少次的频率。你知道吗
我试着使用.value_counts()
,但那只给了我以下的结果
Utterance Frequency
Starbucks 7
Directions 3
Navigate 2
.
.
.
相反,我试图得到以下输出
Utterance Frequency
Starbucks 3666
Directions 2411
Navigate 678
.
.
.
换言之,我只是想知道他们被说了多少次,而不是他们出现了多少行,这才是最令人高兴的值。计数()
谢谢你的帮助!你知道吗
我认为需要:
如果每行仅包含唯一的单词,则解决方案是简化:
解释:
Frequency
创建索引DataFrame
Frequency
乘^{sum
对于O(n)复杂性解决方案,使用
collections.Counter
。你知道吗结果
解释
这应该可以做到:
收益率:
相关问题 更多 >
编程相关推荐