聚类极化:聚类数据的内部和外推。
clusterpolate的Python项目详细描述
散乱数据内插外推的传统方法 在数据点周围的填充矩形区域或 它们充满了凸面的外壳。然而,分散的数据通常包括 不规则形状的不同簇,通常包含 根本没有数据。将这些数据强制转换为传统的- 或外推方案往往不会导致预期的结果。
另一方面,热图能很好地处理散乱的数据,但通常能 不提供真正的插值:相反,它们通常使用 高估目标值的核函数 人口稠密地区。
群集极化是一种混合的内插和外推方案来解决这个问题。 它使用核函数对 局部值,以及数据的密度估计。这个 后者用于将成员度指定给群集极化点: 低会员级别的积分位于 数据不足。