如何在scikitlearn的高斯混合聚类算法中使用权重_init参数？

from cuml import KMeans from sklearn.mixture import GaussianMixture # KMeans performed on GPU cluster w/ CUML library: km = KMeans(n_clusters=K) km.fit_predict(data) labels = km.labels_ centroids = km.cluster_centers_ # GMM performed on CPU w/ sklearn library: gmm = GaussianMixture(n_components=K, means_init=centroids, weights_init=???) labels = gmm.fit_predict(data) centroids = gmm.means_

1条回答

网友

1楼 · 发布于 2024-04-20 13:48:24

下面提供了使用cuML的KMeans为sklearn的GaussianMixture创建权重以代替默认权重的代码。您需要使用从cuML的KMeans模型获得的标签来创建权重。我在下面的示例中使用了make_blobs数据集：

import numpy as np
from cuml.cluster import KMeans as cuKMeans

from sklearn.datasets import make_blobs
from sklearn.cluster import KMeans as skKMeans
from sklearn.metrics import adjusted_rand_score
from sklearn.mixture import GaussianMixture
from sklearn.mixture._gaussian_mixture import _estimate_gaussian_parameters

n_samples = 100
n_features = 2

n_clusters = 5
random_state = 0

data, labels = make_blobs(n_samples=n_samples,
                          n_features=n_features,
                          centers=n_clusters,
                          random_state=random_state,
                          cluster_std=0.1)
km = cuKMeans(n_clusters=n_clusters, n_init=1)
km.fit(data)
label = km.labels_
centroids = km.cluster_centers_

# calculate the weights
resp = np.zeros((n_samples, n_clusters))
resp[np.arange(n_samples), label] = 1

weights, _, _ = _estimate_gaussian_parameters(data, resp, reg_covar=1e-6, covariance_type='full')
weights /= n_samples
print("weights : ", weights)

gmm = GaussianMixture(n_components=n_clusters, means_init=centroids, weights_init=weights)
labels = gmm.fit_predict(data)
gmm_centroids = gmm.means_
print(" gmm_centroids values with cuml weights : ")
print(gmm_centroids)

# default GM without cuml kmeans

default_gmm = GaussianMixture(n_components=n_clusters, means_init=centroids, weights_init=weights)
labels = default_gmm.fit_predict(data)
default_gmm_centroids = default_gmm.means_
print("gmm_centroids values with default weights : ")
print(default_gmm_centroids)

相关问题更多 >

编程相关推荐

热门问题

热门文章