CountVectorizer()实现时出现错误“空词汇表;文档可能只包含停止词”

2024-04-27 22:10:40 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试使用CountVectorizer()对分类变量执行一次热编码。除了一个名为“训练中心”的栏目外,我能够在所有栏目中实现这一点。此列包含三个唯一值“A”、“B”、“C”。当我在此列上实现CountVectorizer时,它会给我一个空词汇表的错误;可能文档只包含停止词

vec=CountVectorizer()
train_drill=vec.fit_transform(X_train['Drill Centre']).toarray()
test_drill=vec.transform(X_test['Drill Centre']).toarray()

enter image description here


Tags: 词汇表test编码错误分类transformtrain中心