聚类重叠椭圆

import itertools import numpy as np import pylab as plt from sklearn import mixture from matplotlib.patches import Ellipse field_File_1 = './dummy_distrib_3.txt' ''' link to data: https://www.dropbox.com/s/jd3wx1ee8r1mj8p/dummy_distrib_3.txt?dl=0 ''' my_dis_1 = np.loadtxt(field_File_1) X = my_dis_1[:50000,:2] BaGaMiMo = mixture.BayesianGaussianMixture(n_components=2, covariance_type='full', weight_concentration_prior_type='dirichlet_distribution').fit(X) X1 = X[BaGaMiMo.predict(X) == 0, :] X2 = X[BaGaMiMo.predict(X) == 1, :] plt.figure(figsize=(18.0, 6.0)) plt.subplot(1,3,1) plt.scatter(X[:,0], X[:,1], 0.2, color='m') plt.subplot(1,3,2) plt.scatter(X[BaGaMiMo.predict(X) == 0, 0], X[BaGaMiMo.predict(X) == 0, 1], .2, color='navy') plt.subplot(1,3,3) plt.scatter(X[BaGaMiMo.predict(X) == 1, 0], X[BaGaMiMo.predict(X) == 1, 1], .2, color='c') plt.show()

1条回答

网友

1楼 · 发布于 2024-06-16 12:28:26

也许这会有帮助。我用predict_proba()代替predict()来得到一个点属于任一组的概率。然后我玩了切断。把截止值设为0.5，我得到的结果和你一样。经过一番反复试验，0.933的临界值似乎能起作用。在

p1 = X[BaGaMiMo.predict_proba(X)[:,0] > 0.933, :]
p2 = X[BaGaMiMo.predict_proba(X)[:,0] <= 0.933, :]
plt.scatter(p1[:,0], p1[:,1], 0.2, color='m')
plt.scatter(p2[:,0], p2[:,1], 0.2, color='navy')

相关问题更多 >

编程相关推荐

热门问题

热门文章