大Pandas中的独特词语及其计数

2条回答

网友

1楼 · 编辑于 2024-04-23 10:08:40

如果您只是想显示单词的频率，可以使用以下方法：

 df['column_with_words'].hist()

但那可能不会给你想要的。最好研究一些文本分析包，比如nltk。你知道吗

网友

2楼 · 编辑于 2024-04-23 10:08:40

同意马克斯的意见，你的问题太宽泛了。然而，您要做的是tokenizing文本并计算每个标记的频率。这可以类似于this question。下面是一个实现：

import nltk

with open ("input.txt", "r") as myfile:
    data=myfile.read().replace('\n', ' ')

data = data.split(' ')
fdist1 = nltk.FreqDist(data)
print(fdist1)

编程相关推荐

使用gitlabci进行GUI测试（java swing）时出现无头异常
tomcatjavaee：在调用时运行一个方法。战争已经展开
java将文档中章节的超链接插入XWPFTable中的单元格
无法将java扫描程序转换为int
java Axis2：只加载一次模块
java JAXB列表中的不同元素
java如何过滤字符串但保留一些标记
java如何检索列表中具有特定属性的所有对象？
java如何在jni中读取2D数组
java Android Studio：非语句错误

相关问题更多 >

编程相关推荐

热门问题

热门文章

大Pandas中的独特词语及其计数

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >