不同纹理的多标签分类

2024-04-29 15:19:51 发布

您现在位置:Python中文网/ 问答频道 /正文

假设我有不同的关键字,标签不同的内容。 例如

    label                                      content
    great, amazing                            our company is bla bla
                                              bla bla bla......

    amazing, horrible,interesting              our company is bla bla
                                              bla bla bla......

    boring                                    our company is bla bla
                                              bla bla bla......

然后,利用分类机器学习模型建立模型。在

有谁能教我如何使这种多标签分类工作和建立?在

另外,我更喜欢使用scikit学习库


Tags: 模型内容is分类our关键字标签content
1条回答
网友
1楼 · 发布于 2024-04-29 15:19:51

是的,我在发这个问题之前已经读过了。然而,它似乎总是过于适合。这是因为sklearn提供的示例只针对一些简单的文本,例如一个句子。然而,我现在看到的课文不是一句话,而是大量的工作。在

实际上,我读过kaggle中的例子。(https://www.kaggle.com/c/word2vec-nlp-tutorial/details/part-1-for-beginners-bag-of-words)它接近我想要的,但是当我试图将它归入多标签分类时,它似乎很容易陷入过度拟合。在

有谁能跟我分享一下他对文本挖掘问题的看法吗?在

相关问题 更多 >