检测不规则或所谓的大纲视图

2条回答

网友

1楼 · 编辑于 2024-05-23 13:54:25

你的问题很广泛。最终你会要求非监督学习而不是监督学习。答案将取决于“这些记录怎么不是自然的”或者“自然”是什么意思。如果没有更好的起点或模型，可以从聚类分析开始。如果到目前为止，大多数记录都是自然的，因为它们之间的距离很小，而有一些记录离得很远，那么聚类分析将帮助您找到这些记录。有趣的一点是如何根据手头的每个问题来定义“距离”。你知道吗

一个明显的起点是hclust中的函数R，您将在Cluster Analysis的CRAN Task视图中找到各种高质量的包：https://cran.r-project.org/web/views/Cluster.html

网友

2楼 · 编辑于 2024-05-23 13:54:25

在所有严肃的统计书籍中，你都会发现一句话：了解你的数据。清理和了解数据是工作的一部分（大多数时候也是最大的一部分）。因此，没有标准程序，但有一些提示：

数值数据：绘制大量的曲线图，如箱线图、散点图、直方图等
分类数据：进行一些统计，例如使用table

您可以在这里找到更多的技术讨论：How to remove outliers from a dataset或一些教程https://www.r-bloggers.com/identify-describe-plot-and-remove-the-outliers-from-the-dataset/

赫本

相关问题更多 >

编程相关推荐

热门问题

热门文章

检测不规则或所谓的大纲视图

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >