如何根据给定的文本拟合模型参数

2024-03-29 00:05:03 发布

您现在位置:Python中文网/ 问答频道 /正文

我想用hmmlearn库(sklearn.HMM)实现基于HMM的信息抽取模型。关键任务是教模型从初始文本中提取采购项目,并给出详细的描述

根据我的问题,我用隐马尔可夫模型来描述任务:隐藏状态(0-不是购买项,1-购买项),排放量没有完全指定(如果你能提出一些建议,欢迎),但我想它可能只是基于初始文本的词汇。 据我所知,最适合我的是具有多项式(离散)发射的隐马尔可夫模型,所以hmm.MultinomialHMM有它的实现。但我不知道如何用我的火车数据来拟合模型。我有一个隐藏状态标记的文本语料库(文本中每个单词0,1),我如何拟合模型来找到我的发射矩阵,状态转移矩阵和初始状态向量

from hmmlearn import hmm

model = hmm.MultinomialHMM(n_components=2)

model.fit(X, lengths=None)


X : array-like, shape (n_samples, n_features)
    Feature matrix of individual samples.

lengths : array-like of integers, shape (n_sequences, )
    Lengths of the individual sequences in ``X``. The sum of
    these should be ``n_samples``.

根据这些论点,我只能输入我的排放模型。我不确定它是否能恰当地拟合模型参数,因为它只给出排放量而没有隐藏状态。如何适当地适合模型,欢迎你给我任何其他建议,根据适当的执行我的问题


Tags: of模型文本model状态矩阵array建议