带sklearn的ML:KNeighborRegressor fit函数卡在一个大DB上

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.25, random_state = 42) regressor = neighbors.KNeighborsRegressor(n_neighbors = n, algorithm = algorithm, weights = weights) regressor.fit(X_train, y_train) y_pred = regressor.predict(X_test) train_score = regressor.score(X_train, y_train) test_score = regressor.score(X_test, y_test)

1条回答

网友

1楼 · 发布于 2024-04-20 12:52:10

这就是KNN的本质。算法的时间复杂度是KNN is O(nd)，其中n是数据点的数量，d是维度（在您的例子中n = 25k, d = 10）

KNN将考虑所有的数据点，并选取最靠近的数据点。因此，如果您的数据很大，则需要更多的时间。K是超参数&您可以使用GridSearchCV或RandomizedSearchCV对其进行调优

您可以选择：

缩小数据规模（例如，将数据点的数量从25k减少到15K）
增加系统内存大小和处理器速度或在云中运行KNN
等待KNN完成
如果有延迟限制，则不使用KNN

您还可以尝试使用RBF内核SVM，因为它是KNN的一个很好的近似值&它将花费更少的时间

相关问题更多 >

编程相关推荐

热门问题

热门文章