擅长:python、mysql、java
<p>你要找的答案在<a href="http://radimrehurek.com/gensim/wiki.html#latent-dirichlet-allocation" rel="noreferrer">gensim tutorial</a>中。<code>lda.printTopics(k)</code>为<code>k</code>随机选择的主题打印最有用的单词。我们可以假设这是(部分)单词在每个给定主题上的分布,这意味着这些单词出现在主题左侧的概率。</p>
<p>通常,人们会在一个大的语料库上运行LDA。在一个小得离谱的样本上运行LDA不会产生最好的结果。</p>