Pythonsklearn.feature_提取.文本.tfidTransform

2024-06-07 05:13:53 发布

您现在位置:Python中文网/ 问答频道 /正文

我不熟悉文本处理Python.In下面的代码tfiddtransformer用于计算给定文档(仅一个文档)的标准化矩阵。我的问题是,在没有指定背景或语料库的情况下,如何计算idf值?我知道要计算idf,我们需要一系列文件。在

sentences = sentence_tokenizer.tokenize(input)
temporary = CountVectorizer().fit_transform(sentences)
normalized_matrix = TfidfTransformer().fit_transform(temporary)

Tags: 文件代码in文档情况sentencestransform矩阵