擅长:python、mysql、java
<p>首先,你必须把所有的文本数据转换成机器可读的形式,因为机器学习算法只理解向量。在</p>
<p>1)找到数据集的词汇</p>
<p>2)使用CountVectorizer()或TfidVectorizer()将文本转换为向量</p>
<p>3)现在在预处理的数据集上训练一个朴素的bayes分类器</p>
<p>更多细节请看这个
<a href="https://machinelearningmastery.com/prepare-text-data-machine-learning-scikit-learn/" rel="nofollow noreferrer">https://machinelearningmastery.com/prepare-text-data-machine-learning-scikit-learn/</a></p>