用classifi预测新数据

2024-04-29 11:38:32 发布

您现在位置:Python中文网/ 问答频道 /正文

嗨,我有一个计划,我试图训练不同的模式,以选择最准确的一个。因此我有:

def updateBestClassifier(predictions, classifier, name, count_vect):
   global bestAccuracy, bestClassifier, modelName, bestCountVect
   if(predictions > bestAccuracy):
      bestAccuracy = predictions
      bestClassifier = classifier
      modelName = name
      bestCountVect = count_vect

其中bestAccuracy最初是0,预测是模型的准确度得分。我用实际的模型更新bestClassifier,用模型名(一个字符串)更新bestCountVect,用count_vect更新bestCountVect

然后我试着用以下几行预测新的文本:

text = unknownDf['Text']
transText =  bestCountVect.transform(text)
predict = bestClassifier.predict(transText )

但是,我得到以下错误:

ValueError: Incompatible dimension for X and Y matrices: X.shape[1] == 17400 while Y.shape[1] == 5000

你知道为什么吗


Tags: textname模型countpredict计划shapeclassifier