2024-05-15 23:20:07 发布
网友
from sklearn.preprocessing import StandardScaler X = df.values[:,1:] X = np.nan_to_num(X) Clus_dataSet = StandardScaler().fit_transform(X) Clus_dataSet
有人理解此上下文的含义吗?
Here is the screenshot!!
df是一个具有多个列的数据帧,显然目标值位于第一列
df
df.values返回一个numpy数组,其中包含数据帧的底层数据,不包含任何索引或列名称
df.values
[:, 1:]是该数组的一个切片,它返回从第二列开始的所有行和每列。(第一列是索引0)
[:, 1:]
df.valuesis将数据帧值作为numpy数组对象提供给我们。df.values[:,1:://strong>是一种通过索引访问所需值的方法,它表示数据帧中除第0个索引列以外的所有行和列
正如Richie在X = df.values[:,1:]中所说的那样,基本上使X等于数据帧,但它跳过了第一列
X = df.values[:,1:]
X = np.nan_to_num(X)用数值替换任何NaN值
X = np.nan_to_num(X)
Clus_dataSet = StandardScaler().fit_transform(X)将数据规范化
Clus_dataSet = StandardScaler().fit_transform(X)
Clus_dataSet返回数据集
Clus_dataSet
请小心,因为稍后在打印数据时,如果使用X变量,则必须从第二列为数据编制索引X[0] = df[1]
X[0] = df[1]
例如:plt.scatter(X[:, 0], X[:, 3], s=area, c=labels.astype(np.float), alpha=0.5)
plt.scatter(X[:, 0], X[:, 3], s=area, c=labels.astype(np.float), alpha=0.5)
X[:, 0]包含新变量的第一列,以前是df[:, 1],如果这有意义的话。很难解释
X[:, 0]
df[:, 1]
df
是一个具有多个列的数据帧,显然目标值位于第一列df.values
返回一个numpy数组,其中包含数据帧的底层数据,不包含任何索引或列名称[:, 1:]
是该数组的一个切片,它返回从第二列开始的所有行和每列。(第一列是索引0)df.valuesis将数据帧值作为numpy数组对象提供给我们。df.values[:,1:://strong>是一种通过索引访问所需值的方法,它表示数据帧中除第0个索引列以外的所有行和列
正如Richie在
X = df.values[:,1:]
中所说的那样,基本上使X等于数据帧,但它跳过了第一列X = np.nan_to_num(X)
用数值替换任何NaN值Clus_dataSet = StandardScaler().fit_transform(X)
将数据规范化Clus_dataSet
返回数据集请小心,因为稍后在打印数据时,如果使用X变量,则必须从第二列为数据编制索引
X[0] = df[1]
例如:
plt.scatter(X[:, 0], X[:, 3], s=area, c=labels.astype(np.float), alpha=0.5)
X[:, 0]
包含新变量的第一列,以前是df[:, 1]
,如果这有意义的话。很难解释相关问题 更多 >
编程相关推荐