关于使用Python进行Kmeans集群,我有两个问题。在
我有一个自动生成的数据叫做神秘.npy它的形状是(30309784)。我试图在其上应用KMeans群集,但收到以下错误:
valueerror: the truth value of an array with more than one element is ambiguous. use a.any() or a.all()
你知道如何克服这个错误,或者如何用KMeans方法对这些数据进行聚类吗?在
第二个问题,是否有某种代码可以知道我所拥有的数据类型?在
非常感谢您的帮助。 谢谢
@Nael Alsaleh,你可以用下面的方法运行K-Means:
注意,
X
是一个numpy数组。这段代码将创建弯头曲线,在这里您可以选择完美数量的簇,在本例中为5-6个。在如果您使用的是numpy,您将拥有一个数组:
^{pr2}$你也可能在处理一个列表
^{3}$需要转换为
array
:np.array(X)
,甚至是Pandas
数据帧:您可以通过执行以下操作来检查
Pandas
数据帧中的列类型:在
numpy
,x.dtype
将数据转换为数组后,运行:
这将得到每个示例所属的集群类的编号。在
可视化:
您可以使用scikit learnsKMeans模块来完成您想做的事情,下面是一个使用您的数据的有效示例:
如果您想使用完整的数据集,
kmeans.fit(mystery)
可能需要一些时间,出于测试目的,我只使用了前1000个实例,并预测了接下来的200个实例。在相关问题 更多 >
编程相关推荐