我编写了一个函数,输出并绘制文本中最常见的单词。请参阅下面的代码和输出
tf = Counter()
for i in list(tweet['text']):
temp=XXX
for tag, count in tf.most_common(20):
print("{}: {}".format(tag, count))
y = [count for tag, count in tf.most_common(20)]
x = range(1, len(y)+1)
plt.bar(x, y)
plt.title("Term frequencies used inTwitter Data")
plt.ylabel("Frequency")
plt.savefig('us-iran-term-distn.png')
输出是最常见的单词,下面有一个图:
blacklivesmatter: 127336
blm: 58619
black: 25973
people: 17960
.
.
lives: 11684
police: 10762
matter: 9902
white: 9766
georgefloyd: 9023
protest: 8734
我怎样才能在x轴上加上最常用的单词
非常感谢
可以直接使用x值的标记列表。Matplotlib将这些文本显示为轴的标签。或者,use可以使用
plt.yscale('log')
更好地区分较低的值下面的代码首先根据zipf分布生成一个随机单词列表
相关问题 更多 >
编程相关推荐