基于区分特征的文本分类

2024-03-28 10:56:00 发布

您现在位置:Python中文网/ 问答频道 /正文

我试着用单词或字符的n-gram鉴别特征对文本进行分类,这意味着特征在一个类中至少出现90%。我正在尝试使用sklearn,但找不到如何实现它。你知道吗

我正在查看sklearn的CountVectorizer/TfidfVectorizer,但找不到如何按类指定特征选择。你知道吗

你能就如何执行这项任务提出建议吗?你知道吗


Tags: 文本分类特征sklearn字符单词建议gram