需要2D数组，但得到了1D数组，请重塑D

# Data Preprocessing # Import Libraries import numpy as np import matplotlib.pyplot as plt import pandas as pd # Import dataset dataset = pd.read_csv('Data2.csv') X = dataset.iloc[:, :-1].values y = dataset.iloc[:, 5].values df_X = pd.DataFrame(X) df_y = pd.DataFrame(y) # Replace Missing Values from sklearn.preprocessing import Imputer imputer = Imputer(missing_values = 'NaN', strategy = 'mean', axis = 0) imputer = imputer.fit(X[:, 3:5 ]) X[:, 3:5] = imputer.transform(X[:, 3:5]) # Encoding Categorical Data "Name" from sklearn.preprocessing import LabelEncoder, OneHotEncoder labelencoder_x = LabelEncoder() X[:, 0] = labelencoder_x.fit_transform(X[:, 0]) # Transform into a Matrix onehotencoder1 = OneHotEncoder(categorical_features = [0]) X = X.reshape(-1, 1) X[:, 0] = onehotencoder1.fit_transform(X[:, 0]).toarray() # Encoding Categorical Data "University" from sklearn.preprocessing import LabelEncoder labelencoder_x1 = LabelEncoder() X[:, 1] = labelencoder_x1.fit_transform(X[:, 1])

File "/Users/jim/anaconda3/lib/python3.6/site-packages/sklearn/preprocessing/data.py", line 1809, in _transform_selected X = check_array(X, accept_sparse='csc', copy=copy, dtype=FLOAT_DTYPES) File "/Users/jim/anaconda3/lib/python3.6/site-packages/sklearn/utils/validation.py", line 441, in check_array "if it contains a single sample.".format(array)) ValueError: Expected 2D array, got 1D array instead: array=[ 2.00000000e+00 7.00000000e+00 3.20000000e+00 2.70000000e+01 2.30000000e+03 1.00000000e+00 6.00000000e+00 3.90000000e+00 2.80000000e+01 2.90000000e+03 3.00000000e+00 4.00000000e+00 4.00000000e+00 3.00000000e+01 2.76700000e+03 2.00000000e+00 8.00000000e+00 3.20000000e+00 2.70000000e+01 2.30000000e+03 3.00000000e+00 0.00000000e+00 4.00000000e+00 3.00000000e+01 2.48522222e+03 5.00000000e+00 9.00000000e+00 3.50000000e+00 2.50000000e+01 2.50000000e+03 5.00000000e+00 1.00000000e+00 3.50000000e+00 2.50000000e+01 2.50000000e+03 0.00000000e+00 2.00000000e+00 3.00000000e+00 2.90000000e+01 2.40000000e+03 4.00000000e+00 3.00000000e+00 3.70000000e+00 2.77777778e+01 2.30000000e+03 0.00000000e+00 5.00000000e+00 3.00000000e+00 2.90000000e+01 2.40000000e+03]. Reshape your data either using array.reshape(-1, 1) if your data has a single feature or array.reshape(1, -1) if it contains a single sample.

3条回答

网友

1楼 · 编辑于 2024-04-29 14:53:04

好吧，我终于把代码搞定了。请参阅下面的解决方案：

# Data Preprocessing

# Import Libraries
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

# Import Dataset
dataset = pd.read_csv('Data2.csv')
X = dataset.iloc[:, :-1].values
y = dataset.iloc[:, 5].values
df_X = pd.DataFrame(X)
df_y = pd.DataFrame(y)

# Replace Missing Values
from sklearn.preprocessing import Imputer
imputer = Imputer(missing_values = 'NaN', strategy = 'mean', axis = 0)
imputer = imputer.fit(X[:, 3:5 ])
X[:, 3:5] = imputer.transform(X[:, 3:5])


# Encoding Categorical Data "Name"
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
labelencoder_x = LabelEncoder()
X[:, 0] = labelencoder_x.fit_transform(X[:, 0])


# Encoding Categorical Data "University"
from sklearn.preprocessing import LabelEncoder
labelencoder_x1 = LabelEncoder()
X[:, 1] = labelencoder_x1.fit_transform(X[:, 1])


# Transform Name into a Matrix
onehotencoder1 = OneHotEncoder(categorical_features = [0])
X = onehotencoder1.fit_transform(X).toarray()

# Transform University into a Matrix
onehotencoder2 = OneHotEncoder(categorical_features = [6])
X = onehotencoder2.fit_transform(X).toarray()

网友

2楼 · 编辑于 2024-04-29 14:53:04

试着把你的代码改成这个

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

# Import Dataset
dataset = pd.read_csv('Data2.csv')
X = dataset.iloc[:, :-1].values
y = dataset.iloc[:, 5].values
df_X = pd.DataFrame(X)
df_y = pd.DataFrame(y)

# Replace Missing Values
from sklearn.preprocessing import Imputer
imputer = Imputer(missing_values = 'NaN', strategy = 'mean', axis = 0)
imputer = imputer.fit(X[:, 3:5 ])
X[:, 3:5] = imputer.transform(X[:, 3:5])


# Encoding Categorical Data "Name"
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
labelencoder_x = LabelEncoder()
X[:, 0] = labelencoder_x.fit_transform(X[:, 0])

# Transform into a Matrix

onehotencoder1 = OneHotEncoder(categorical_features = [0])
res_0 = onehotencoder1.fit_transform(X[:, 0].reshape(-1, 1))  # <=== Change
X[:, 0] = res_0.ravel()

# Encoding Categorical Data "University"
from sklearn.preprocessing import LabelEncoder
labelencoder_x1 = LabelEncoder()
X[:, 1] = labelencoder_x1.fit_transform(X[:, 1])

如果您在labelencoder_x1.fit_transform(X[:, 1])处遇到错误，请将其设为labelencoder_x1.fit_transform(X[:, 1].reshape(-1, 1))

网友

3楼 · 编辑于 2024-04-29 14:53:04

我也犯了同样的错误。我正在转换一列数据。在这里，我如何克服这个问题

encoding_X = OneHotEncoder(categories = [np.unique(X[:,0]).tolist()])
encoding_X.fit(np.unique(X[:,0]).reshape(-1,1).tolist())
encoding_X.transform(X[:,0].reshape(-1,1).tolist()).toarray()

相关问题更多 >

编程相关推荐

热门问题

热门文章