具有4个参数的数据集聚类与标记

Name Class Subclass Category Subcategory Lightpack circuitboard E 1 4 9 Lego blocks F 2 56 12 D/C connector E 3 4 1 Colorful dog hat D 6 10 1 Grandma's shoes D 2 11 1 Low temp resistor O 2 4 10

2条回答

网友

1楼 · 编辑于 2024-05-29 06:00:54

无监督算法是你需要去做的。（Why so?）

这里您需要理解的关键概念是Multivariate distances是什么以及如何计算它们。然后可以应用K-means集群。在

您也可以阅读并使用PCA。您可能需要缩放变量才能使PCA正常工作。在

网友

2楼 · 编辑于 2024-05-29 06:00:54

正如正确指出的那样，您可以使用任何一种聚类算法（K-均值或其变体、层次聚类、EM算法）。该过程遵循一种简单易行的方法将数据点分类到一定数量的簇。由于聚类数是未知的，对于K意味着可以尝试用不同级别的K，并用Elbow方法选择一个最合适的或者层次聚类将允许你找到最好的K

编程相关推荐

如何使用Java中的扫描仪读取文本文件中的特定字符？
java如果我们在hibernate中开始事务但不提交它，会发生什么？
Azure CosmosDB Java Springboot中的无服务器帐户不支持spring boot设置提供吞吐量或容器自动导航
附加到新对象的Java注释？
java如何将自定义文本视图添加到。在Kotlin中添加通知操作
java Shibboleth添加_OpenSAMLcookies，导致HTTP头大小>8k
分布式传感器数据（~40Hz）的高效Java观测器设计
java如何在while循环外声明数组，但在while循环中初始化它？
用@XmlElementRef注释的java元素没有显示在JAXB编组字符串中？
java替换二维数组的值

相关问题更多 >

编程相关推荐

热门问题

热门文章