2024-04-23 19:16:49 发布
网友
我把CountVectorizer和CharNGramAnalyzer搞混了。据我所知
我的理解正确吗?如果没有,我想要一个详细的解释或任何来源的解释。在
首先,检查你的sklearn版本。我觉得你用的是旧版本的sklearn。你对CountVectorizer的解释是不对的。它不计算语料库中不同单词的数量,至少不包括当前版本。在
CountVectorizer
根据docs of CountVectorizer,您需要传递analyzer='word'以使单词计数。在sklearn的最新版本中,CharNGramAnalyzer被弃用,现在与CountVectorizer合并。只需执行analyzer='char'来复制CharNGramAnalyzer。要验证此检查,http://scikit-learn.org/stable/modules/classes.html#module-sklearn.feature_extraction.text没有CharNGramAnalyzer的条目
analyzer='word'
CharNGramAnalyzer
analyzer='char'
首先,检查你的sklearn版本。我觉得你用的是旧版本的sklearn。你对
CountVectorizer
的解释是不对的。它不计算语料库中不同单词的数量,至少不包括当前版本。在根据docs of CountVectorizer,您需要传递
analyzer='word'
以使单词计数。在sklearn的最新版本中,CharNGramAnalyzer
被弃用,现在与CountVectorizer
合并。只需执行analyzer='char'
来复制CharNGramAnalyzer
。要验证此检查,http://scikit-learn.org/stable/modules/classes.html#module-sklearn.feature_extraction.text没有CharNGramAnalyzer
的条目相关问题 更多 >
编程相关推荐