为什么我的系数只有一维？

from nltk.corpus import stopwords from sklearn.feature_extraction.text import CountVectorizer from sklearn.feature_extraction.text import TfidfTransformer from sklearn.naive_bayes import BernoulliNB from sklearn import cross_validation from sklearn.metrics import classification_report import numpy as np from sklearn.metrics import accuracy_score import textblob as TextBlob #scikit comments = list(['happy','sad','this is negative','this is positive', 'i like this', 'why do i hate this']) classes = list(['positive','negative','negative','positive','positive','negative']) # preprocess creates the term frequency matrix for the review data set stop = stopwords.words('english') count_vectorizer = CountVectorizer(analyzer =u'word',stop_words = stop, ngram_range=(1, 3)) comments = count_vectorizer.fit_transform(comments) tfidf_comments = TfidfTransformer(use_idf=True).fit_transform(comments) # preparing data for split validation. 60% training, 40% test data_train,data_test,target_train,target_test = cross_validation.train_test_split(tfidf_comments,classes,test_size=0.2,random_state=43) classifier = BernoulliNB().fit(data_train,target_train) classifier.coef_.shape

1条回答

网友

1楼 · 发布于 2024-04-19 19:38:30

在source code for scikit learn preprocessing module中，LabelBinarizer类实现了多标签分类的one-vs-all方案。在这里可以看到，如果只有两个类，它学习一组系数，这些系数预测样本是否属于类“1”，如果不是，分类器预测“0”。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章