我应该如何修改SVM方法的测试数据，以便能够使用“预计算”的核函数而不会出错？

index density speed label 0 14 58.844020 77.179139 1 29 67.624946 78.367394 2 44 77.679100 79.143744 3 59 79.361877 70.048869 4 74 72.529289 74.499239 .... and so on from sklearn import svm import pandas as pd import numpy as np density = np.random.randint(0,100, size=(3000, 1)) speed = np.random.randint(20,80, size=(3000, 1)) + np.random.random(size=(3000, 1)) label = np.random.randint(20,80, size=(3000, 1)) + np.random.random(size=(3000, 1)) d = np.hstack((a,b,c)) data = pd.DataFrame(d, columns=['density', 'speed', 'label']) data.density = data.density.astype(dtype=np.int32) def my_kernel(X,Y): return np.dot(X,X.T) svr = svm.SVR(kernel=my_kernel) x = data[['density', 'speed']].iloc[:2000] y = data['label'].iloc[:2000] x_t = data[['density', 'speed']].iloc[2000:3000] y_t = data['label'].iloc[2000:3000] svr.fit(x,y) y_preds = svr.predict(x_t)

2条回答

网友

1楼 · 编辑于 2024-04-25 15:08:31

问题出在你的内核函数里，它不起作用。你知道吗

正如文档https://scikit-learn.org/stable/modules/svm.html#using-python-functions-as-kernels所说，“您的内核必须将两个形状为(n_samples_1, n_features)，(n_samples_2, n_features)的矩阵作为参数，并返回形状为(n_samples_1, n_samples_2)的内核矩阵。”同一页上的示例内核满足以下条件：

def my_kernel(X, Y):
    return np.dot(X, Y.T)

在函数中，dot的第二个参数是X.T，因此输出将具有(n_samples_1, n_samples_1)的形状，这不是预期的形状。你知道吗

网友

2楼 · 编辑于 2024-04-25 15:08:31

形状不匹配意味着测试数据和训练数据的形状不相等，通常在numpy中考虑矩阵或数组。如果你做任何算术运算，你总是需要一个类似的形状。所以我们才查数组.shape. [n\u samples\u test，n\u samples\u train]您可以修改形状，但这不是最好的主意。你知道吗

数组.shape，重塑，调整大小 是用来做这个的

相关问题更多 >

编程相关推荐

热门问题

热门文章