无法在python(jupyter)中创建术语文档矩阵

2024-06-16 11:18:37 发布

您现在位置:Python中文网/ 问答频道 /正文

在jupyter中运行以下代码以创建term document matrix时,我得到一个错误消息:name'textmining'not defined。在

代码如下:

#create term document matrix
tdm = textmining.TermDocumentMatrix(post_corpus)

for i in post_corpus:
    #print(i)
    tdm.add_doc(i)

NameError: name 'textmining' is not defined

我通过运行以下代码检查是否安装了文本挖掘功能:

^{2}$

运行后输出为:

已满足要求:c:\users\asus\anaconda3\lib\site packages(1.0)中的文本挖掘

已满足要求:词干来自c:\users\asus\anaconda3\lib\site packages(1.0.1)

对于在创建术语文档矩阵期间发生的名称错误,我应该怎么做?有没有其他方法来创建这个术语文档矩阵?在


Tags: 代码name文本错误notcorpuspostdocument
1条回答
网友
1楼 · 发布于 2024-06-16 11:18:37

你进口了吗?在

import textmining

tdm = textmining.TermDocumentMatrix()
for post in post_corpus:
    tdm.add_doc(post)

在更新:08-11-2018 我们可以用scikit learn得到同样的结果

要求:

^{pr2}$

安装后:

import pandas as pd
from sklearn.feature_extraction.text import CountVectorizer

corpus =['John and Bob are brothers.'
    ,'John went to the store. The store was closed.'
    ,'Bob went to the store too.',]


vectorizer = CountVectorizer()
X = vectorizer.fit_transform(corpus)

df= pd.DataFrame(X.toarray(), columns=vectorizer.get_feature_names())

结果: enter image description here

相关问题 更多 >