Python KMeans 聚类词汇
我想用Leveshtein距离来对一组单词进行k均值聚类。
1) 我知道有很多框架可以用,比如scipy和orange,它们都有k均值的实现。不过这些框架都需要一些向量作为数据,这对我来说不太合适。
2) 我需要一个好的聚类实现。我看了python-clustering,发现它有两个问题:a) 它不返回每个中心点的所有距离的总和,b) 它没有任何迭代限制或截止条件,这样就不能保证聚类的质量。python-clustering和daniweb上的聚类算法对我来说都不太好用。
有没有人能推荐一个好的库?谷歌对我没什么帮助。