如何从CSV文件中训练和测试一个简单的二进制分类器？ - 问答 - Python中文网

如何从CSV文件中训练和测试一个简单的二进制分类器？

2024-04-27 21:19:30 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我用tweets bigram制作了一个低于CSV的文件，我想训练一个模型来预测标签。我在网上找到的大多数例子都包含带有附加参数的数字特征，这让人很难理解。在这里，我问了一个非常简单的示例，以了解使用python（使用scikit learn之类的库）应该做些什么来使用这个最简单的CSV数据集训练和测试分类模型（任何模型）

bigram, label
I love, 0
love you, 0
I hate, 1
hate you, 1
...

我希望这篇文章也能帮助其他机器学习初学者

Tags：文件 csv 模型 you 示例参数数字特征

1条回答

网友

1楼 · 发布于 2024-04-27 21:19:30

下面是示例代码，但是，还有更多内容

from sklearn.pipeline import Pipeline
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.naive_bayes import MultinomialNB
from sklearn.svm import LinearSVC

# Naïve Bayes:
text_clf_nb = Pipeline([('tfidf', TfidfVectorizer()),
                     ('clf', MultinomialNB()),
])

text_clf_nb.fit(X_train, y_train)

predictions = text_clf_nb.predict(X_test)

相关问题更多 >

编程相关推荐

热门问题

热门文章