我使用下面的代码使用scikitlearn创建k-means集群。在
kmean = KMeans(n_clusters=nclusters,n_jobs=-1,random_state=2376,max_iter=1000,n_init=1000,algorithm='full',init='k-means++')
kmean_fit = kmean.fit(clus_data)
我还用kmean_fit.cluster_centers_
保存了质心
然后我把K表示对象。在
^{pr2}$这样我就可以加载相同的kmeans pickle对象,并在新数据出现时使用kmean_fit.predict().
将其应用到新数据中
问题:
加载kmeans pickle对象的方法和应用
kmean_fit.predict()
请允许我将新观察分配给
基于现有簇的质心的现有簇?这种方法是否只是从零开始对新数据进行重新分类?
如果此方法不起作用,如何将新观察分配给 现有的集群,因为我已经保存了集群 使用Efficient python代码的centriods?
PS:我知道使用现有的集群作为因变量来构建一个classifier是另一种方法,但是由于时间紧迫,我不想这样做。在
是的。无论
sklearn.cluster.KMeans
对象是否被pickle(如果您正确地取消了pickle,您将处理“相同”的原始对象)都不影响您可以使用predict
方法对新观察进行聚类。在例如:
输出:
^{pr2}$继续:
输出:
^{pr2}$看看}参数在}对象之间是如何相同的?你可以走了。在
n_clusters
和{model
和{用“新”模型预测:
相关问题 更多 >
编程相关推荐