因此,我已经成功地找到了python中kmeans算法所需的最佳集群数量,但是现在我如何知道在python中应用kmeans之后得到的确切的集群大小呢?在
下面是一个代码片段
data=np.vstack(zip(simpleassetid_arr,simpleuidarr))
centroids,_ = kmeans(data,round(math.sqrt(len(uidarr)/2)))
idx,_ = vq(data,centroids)
initial = [cluster.vq.kmeans(data,i) for i in range(1,10)]
var=[var for (cent,var) in initial] #to determine the optimal number of k using elbow test
num_k=int(raw_input("Enter the number of clusters: "))
cent, var = initial[num_k-1]
assignment,cdist = cluster.vq.vq(data,cent)
您可以使用以下命令获取群集大小:
对于下面的示例,
^{pr2}$np.bincount(idx)
输出一个由两个元素组成的数组,例如[ 156 144]
相关问题 更多 >
编程相关推荐