PyLDAvis可视化与生成的主题不一致

2024-05-17 16:58:30 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用派尔戴维斯来可视化Mallet的LDA结果

在此之前,我需要gensim库的包装:

model = gensim.models.wrappers.ldamallet.malletmodel2ldamodel(model_list[8])

打印找到的主题时,它们从0到10排序

但是,当我使用pyLDAvis可视化主题时,主题顺序(0-10)与打印的主题不一致

例如:

(5,
  '0.042*"euro" + 0.030*"smartpho" + 0.022*"camera" + 0.020*"display" + '
  '0.018*"model" + 0.016*"picture" + 0.012*"price" + 0.010*"android"')

正如你所看到的,这个主题是关于智能手机的

然而,当我用派尔戴维斯形象化模型时,主题5不是关于智能手机,而是关于另一个主题(例如汽车)。智能手机的主题不再是5,而是主题1

例1:

enter image description here

例2: enter image description here

这是已知错误还是正常情况? 有人能帮忙吗


Tags: 主题model排序顺序models可视化list智能手机