tfidf向量空间中的ntc形式到底是什么?

2024-05-29 08:30:19 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一套文本文档。我被要求在tf idf向量空间和ntc形式中显示每个文档,然后在python中基于文档向量训练svm模型。ntc在这里到底是什么意思

我发现它和tf idf权重一样,有一个标准化步骤,叫做“余弦标准化”。但我找不到关于这件事的信息。我发现“余弦相似性”和“余弦归一化”是不同的。它们是一样的吗?我如何在python中创建这个向量


Tags: 文档模型信息tf空间步骤文本文档相似性
1条回答
网友
1楼 · 发布于 2024-05-29 08:30:19

我建议使用sklearn.feature\u extraction.text.tfidfvectorier, scikit learn是python中用于训练机器学习模型的bib, 这很简单,也很有用

相关问题 更多 >

    热门问题