<太长了,读不下去了,有没有办法在流水线上的一个步骤调用“拟合< EM >和< EEM>转换数据”,以在管道的下一个步骤中用作超参数?你知道吗
我有一个Pipeline
,其中包括用TfidfVectorizer
拟合和转换文本数据,然后运行RandomForestClassifier
。我想根据转换从文本中产生的特征数量,跨分类器中不同级别的GridSearchCV
。你知道吗
#setup pipeline
pipe = Pipeline([
('vect', TfidfVectorizer(max_df=.4,
min_df=3,
norm='l1',
stop_words='english',
use_idf=False)),
('rf', RandomForestClassifier(random_state=1,
criterion='entropy',
n_estimators=800))
])
#setup parameter grid
params = {
'rf__max_features': np.arange(1, len(vect.get_feature_names()),1)
}
NameError: name 'vect' is not defined
如果我调整TfidfVectorizer
的一个参数,比如ngram_range
,你可以看到这是如何改变输出到下一步的特性数量的。。。你知道吗
目前没有回答
相关问题 更多 >
编程相关推荐