擅长:python、mysql、java
<p>正如Richie在<code>X = df.values[:,1:]</code>中所说的那样,基本上使X等于数据帧,但它跳过了第一列</p>
<p><code>X = np.nan_to_num(X)</code>用数值替换任何NaN值</p>
<p><code>Clus_dataSet = StandardScaler().fit_transform(X)</code>将数据规范化</p>
<p><code>Clus_dataSet</code>返回数据集</p>
<p>请小心,因为稍后在打印数据时,如果使用X变量,则必须从第二列为数据编制索引<code>X[0] = df[1]</code></p>
<p>例如:<code>plt.scatter(X[:, 0], X[:, 3], s=area, c=labels.astype(np.float), alpha=0.5)</code></p>
<p><code>X[:, 0]</code>包含新变量的第一列,以前是<code>df[:, 1]</code>,如果这有意义的话。很难解释</p>