了解Gensim LDA Mod中的参数

2024-04-19 22:36:37 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用gensim.models.ldamodel.LdaModel来执行LDA,但是我不理解一些参数,在文档中找不到解释。如果有人有与此相关的工作经验,我希望进一步了解这些参数的含义。 具体来说,我不明白:

  • random_state
  • update_every
  • chunksize
  • passes
  • alpha
  • per_word_topics

我正在处理一个由500个文档组成的语料库,每个文档大约有3-5页(不幸的是,由于保密原因,我无法共享数据的快照)。目前我已设置

  • num_topics = 10
  • random_state = 100
  • update_every = 1
  • chunksize = 50
  • passes = 10
  • alpha = 'auto'
  • per_word_topics = True

但这仅仅是基于我看到的一个例子,我不确定这对我的数据有多普遍。


Tags: 数据文档alpha参数modelsupdaterandomword