什么是df.values[:,1:]?

2024-05-15 23:20:07 发布

您现在位置:Python中文网/ 问答频道 /正文

from sklearn.preprocessing import StandardScaler
X = df.values[:,1:] 
X = np.nan_to_num(X)
Clus_dataSet = StandardScaler().fit_transform(X)
Clus_dataSet

有人理解此上下文的含义吗?

Here is the screenshot!!


Tags: tofromimportdfnptransformsklearnnan
3条回答
  • df是一个具有多个列的数据帧,显然目标值位于第一列

  • df.values返回一个numpy数组,其中包含数据帧的底层数据,不包含任何索引或列名称

  • [:, 1:]是该数组的一个切片,它返回从第二列开始的所有行和每列。(第一列是索引0)

df.valuesis将数据帧值作为numpy数组对象提供给我们。df.values[:,1:://strong>是一种通过索引访问所需值的方法,它表示数据帧中除第0个索引列以外的所有行和列

正如Richie在X = df.values[:,1:]中所说的那样,基本上使X等于数据帧,但它跳过了第一列

X = np.nan_to_num(X)用数值替换任何NaN值

Clus_dataSet = StandardScaler().fit_transform(X)将数据规范化

Clus_dataSet返回数据集

请小心,因为稍后在打印数据时,如果使用X变量,则必须从第二列为数据编制索引X[0] = df[1]

例如:plt.scatter(X[:, 0], X[:, 3], s=area, c=labels.astype(np.float), alpha=0.5)

X[:, 0]包含新变量的第一列,以前是df[:, 1],如果这有意义的话。很难解释

相关问题 更多 >