我正在尝试使用sklearn将一些tweet作为字典进行分类 我有25个初始质心id(tweet id) 我在自己的函数中编写了它,但是我不知道如何用sklearn实现它
# {845512:'tweet id 845512', 543115:'tweet id 543115', ...}
# initial_centroids = [845512, 546318, 84632, ...] - 25 centroids
NOTE: tweets_vec <= I need to make it by jaccard_distance
tweets_vec = Is the jaccard distance matrix (it may be wrong, i dont know)
kmeans = KMeans(n_clusters=25, init=initial_seeds).fit(tweets_vec)
我做了一个二维矩阵,其中有jaccard距离。我不知道如何在kmeans方法中修复init。这是错误,这不是错误
我到底应该传递什么呢?你知道吗
如果在kmeans中传递
init=initial_centroids
,那么initial_centroids
必须具有形状clusters x features
。如果只使用一个功能,则可能需要重新调整阵列的形状,请尝试:并将其作为kmeans中的
init
参数传递。希望这有帮助。你知道吗相关问题 更多 >
编程相关推荐