Python中文
首页
教程
问答
标签
搜索
登录
注册
在上将Tweet分类为多个类别(无监督数据/tweets)
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我想把tweet分成预先定义的类别(比如:运动、健康和10个以上)。如果我有标记的数据,我可以通过训练朴素贝叶斯或支持向量机来进行分类。如<a href="http://cucis.ece.northwestern.edu/publications/pdf/LeePal11.pdf" rel="nofollow">http://cucis.ece.northwestern.edu/publications/pdf/LeePal11.pdf</a>所述</p> <p>但我无法找到一种方法来处理未标记的数据。一种可能的方法是使用期望最大化,生成集群并标记这些集群。但如前所述,我已经预先定义了一组类,所以集群不会那么好。在</p> <p>有谁能指导我该学什么技巧吗。谢谢你的帮助。在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>实际上,这似乎是半监督学习的典型用例。这里有很多方法可以使用,包括带约束的聚类(强制模型将来自同一类的样本聚集在一起)、转化学习(尝试将模型从标记样本外推到未标记样本的分布上)。在</p> <p>你也可以像@Shoaib建议的那样简单地对数据进行聚类,但是你必须想出一种启发式的方法来处理带有混合标记的聚类。此外,很明显,解决与任务无关的优化问题(标记)并不如实际使用这些知识。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何找到类似于How'matplotlib.pyplot.gcf()`works?
1 回答
如何找到类字段的定义?
3 回答
如何找到精灵在团队中的位置?
4 回答
如何找到素数,但有错误。我找不到你
1 回答
如何找到素数(Python)
8 回答
如何找到索引i右侧的不同值
3 回答
如何找到索引Numpy数组时将折叠哪些轴?
4 回答
如何找到索引中的值,在列表中增加值?
2 回答
如何找到纬度/经度/高度点之间的三维距离?
4 回答
如何找到线和numpy meshgrid生成的曲面之间的交点?
5 回答
如何找到线段上距任意点最近的点?
9 回答
如何找到组中所有可能的子组
1 回答
如何找到组内值之间的最小差异
5 回答
如何找到经过训练的朴素贝叶斯分类器用于决策的单词?
9 回答
如何找到给selenium webdriver对象的文件夹名?
4 回答
如何找到给出最佳分数的列车测试分割的最佳随机状态值?
4 回答
如何找到给定Python发行版提供的模块?
4 回答
如何找到给定subversion工作副本的根文件夹
3 回答
如何找到给定一维阵列中的所有峰值?
3 回答
如何找到给定列表中的字符串组合,这些字符串加起来就是某个字符串(没有外部库)
5 回答