我正在尝试使用CountVectorizer()对分类变量执行一次热编码。除了一个名为“训练中心”的栏目外,我能够在所有栏目中实现这一点。此列包含三个唯一值“A”、“B”、“C”。当我在此列上实现CountVectorizer时,它会给我一个空词汇表的错误;可能文档只包含停止词
vec=CountVectorizer()
train_drill=vec.fit_transform(X_train['Drill Centre']).toarray()
test_drill=vec.transform(X_test['Drill Centre']).toarray()
目前没有回答
相关问题 更多 >
编程相关推荐