在H2o-KMEANS聚类中求点到簇质心的距离

2024-05-23 18:01:12 发布

您现在位置:Python中文网/ 问答频道 /正文

在H2O-KMeans星团中。有没有办法计算出数据集中每个点到簇质心的实际距离? 目前H2o给出了所传递数据的预测聚类,但如何获得一个点距其聚类质心的距离的最佳方法。在

我打算用这个来检测异常,在远离质心的点被视为异常。我没有使用apachespark,但是我打算尝试使用Sparking Water,但是h2oapi似乎没有显示从集群质心获得每个点距离的最佳方法。在


Tags: 数据方法距离聚类kmeans质心water办法
1条回答
网友
1楼 · 发布于 2024-05-23 18:01:12

不幸的是,目前还没有从R或Python中实现这一点的方法。H2O在Java中有一个方法,但它从未在R/Python中公开过,所以我为这个here添加了一个问题。

同时,您可以编写自定义代码来执行此操作,也可以使用深度学习的自动编码器进行异常检测(示例见tutorial)。

相关问题 更多 >