我们能让gensim lda模型在确定新文档主题时使用预先确定的主题分布吗
例:
import gensim
texts=[['a','a','a'], ['b','b','b'],['c','c','c']]
d = gensim.corpora.Dictionary(texts)
bow = [d.doc2bow(doc) for doc in texts]
import numpy as np
user_topics=np.array([[1, 0, 0],[0, 1, 0],[0,0,1]])
model = gensim.models.LdaModel(corpus=bow, id2word=d, num_topics=3, random_state=1,eta=user_topics)
model.get_topics()
返回
array([[0.9728407 , 0.01204113, 0.01511812],
[0.01140388, 0.9742677 , 0.01432837],
[0.02468761, 0.00788806, 0.9674243 ]], dtype=float32)
model.get_topics()
是否可能返回与“eta”相同的分布
即
[[1, 0, 0],[0, 1, 0],[0,0,1]]
目前没有回答
相关问题 更多 >
编程相关推荐