在构建Gensim LDA模型时,我使用以下命令获取数据字典
from gensim.corpora import Dictionary
dictionary1 = Dictionary(docs)
dictionary1.filter_extremes(no_below=10, no_above=0.75, keep_n = 1000)
在这1000个最常见的令牌中,我手动删除了500个令牌,以便剩余的令牌与我要生成的主题直接相关。 我怎样才能从这个新的dict类型的词典中进一步形成语料库文档呢?我应该用什么形式来训练我的LDA模型呢?你知道吗
您可以对LDA模型进行如下训练:
相关问题 更多 >
编程相关推荐