如何预处理建模数据

2024-06-16 11:04:23 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个数据集,其中每一列都有一个对应于每一行的支柱/数组/整数。此外,每个单元中的结构或阵列具有不同的尺寸。有谁能指导我如何将这些数据扁平化/结构化,以便我可以使用它来构建支持向量机模型或用作聚类的输入数据

以下是数据的示例: a_data b_data ........n_data r1 7.162 [24×1] strut [6×2]double r2 0.1945 [361×1] strut [40×2]double . . . rn

[24条×1] 结构类似于 732338.705682870 0 'no' 732338.706597222 1 'yes' 732338.707777778 0 'maybe' 732339.525729167 0 'yes'

我不确定是否必须对此类数据进行标准化/规范化/二值化,以及如何在这个数据集上实现它。任何关于这方面的信息或处理类似数据的经验都将不胜感激


Tags: 数据模型data尺寸整数数组结构向量