我正在尝试对一些文本数据进行聚类,并遵循scikit-learn example进行聚类
在本例中,您可以选择使用哈希向量器,后跟TF-IDF向量器,这是默认管道:
# Perform an IDF normalization on the output of HashingVectorizer
hasher = HashingVectorizer(n_features=opts.n_features,
stop_words='english', alternate_sign=False,
norm=None)
vectorizer = make_pipeline(hasher, TfidfTransformer())
目前没有回答
相关问题 更多 >
编程相关推荐