sci工具包学习：使用X.reforme（-1，1）重塑数据

def main(): data = [] folds = 10 ex = [ [] for x in range(0,10)] results = [] for i,f in enumerate(sys.argv[1:]): data.append(csv.DictReader(open(f,'r'),delimiter='\t')) for f in data: for i,datum in enumerate(f): ex[i % folds].append(datum) #print ex for held_out in range(0,folds): l = [] cor = [] l_test = [] cor_test = [] vec = [] vec_test = [] for i,fold in enumerate(ex): for line in fold: if i == held_out: l_test.append(line['label'].rstrip("\n")) cor_test.append(line['text'].rstrip("\n")) else: l.append(line['label'].rstrip("\n")) cor.append(line['text'].rstrip("\n")) vectorizer = CountVectorizer(ngram_range=(1,1),min_df=1) X = vectorizer.fit_transform(cor) for c in cor: tmp = vectorizer.transform([c]).toarray() vec.append(tmp[0]) for c in cor_test: tmp = vectorizer.transform([c]).toarray() vec_test.append(tmp[0]) clf = MultinomialNB() clf .fit(vec,l) result = accuracy(l_test,vec_test,clf) print result if __name__ == "__main__": main()

3条回答

网友

1楼 · 编辑于 2024-05-12 22:26:45

在clf.fit（vec，l.fit）中输入的“vec”必须是[[]]类型，而不仅仅是[]。这是一个怪癖，我总是忘记当我适合模型。

只需添加一组额外的方括号就可以了！

网友

2楼 · 编辑于 2024-05-12 22:26:45

如果您想知道Warning来自何处，可以临时将Warnings提升到Exceptions。这将给您一个完整的回溯，因此您的程序遇到警告的行。

with warnings.catch_warnings():
    warnings.simplefilter("error")
    main()

如果从命令行运行程序，还可以使用-W标志。有关警告处理的详细信息可以在python documentation中找到。

我知道这只是你问题的一部分，但你调试了你的代码吗？

网友

3楼 · 编辑于 2024-05-12 22:26:45

它是：

pred = clf.predict(vec);

我在代码中使用了这个，它成功了：

#This makes it into a 2d array
temp =  [2 ,70 ,90 ,1] #an instance
temp = np.array(temp).reshape((1, -1))
print(model.predict(temp))

相关问题更多 >

编程相关推荐

热门问题

热门文章