PySpark&MLLib：随机森林预测结果总是0

2024-04-23 16:44:40 发布

男 | 程序猿一只，喜欢编程写python代码。

df = pd.read_csv(r'main.csv', header=0)
spark = SparkSession \
    .builder \
    .master("local") \
    .appName("myapp") \
    .getOrCreate()
s_df = spark.createDataFrame(df)
transformed_df = s_df.rdd.map(lambda row: LabeledPoint(row[0], Vectors.dense(row[1:])))

splits = [0.7, 0.3]
training_data, test_data = transformed_df.randomSplit(splits, 100)
model = RandomForest.trainClassifier(training_data, numClasses=2, categoricalFeaturesInfo={},
                                 numTrees=3, featureSubsetStrategy="auto",
                                 impurity='gini', maxDepth=4, maxBins=32)

predictions = model.predict(test_data.map(lambda x: x.features))

打印测试时_数据.map（lambda x:x.features）结果是

[DenseVector([1431500000.0, 9.3347, 79.8337, 44.6364, 194.0, 853.0, 196.9998]),
 DenseVector([1431553600.0, 9.5484, 80.7409, 39.5968, 78.0, 923.0, 196.9994])....]

DenseVector([numbers])中的数字对于预测是正确的

但是预测的结果是0

[0.0, 0.0, 0.0, 0.0, 0.0...]

Tags： csv lambda test map df data model training

0条回答

目前没有回答

PySpark&MLLib：随机森林预测结果总是0

相关问题更多 >

编程相关推荐

热门问题

热门文章

PySpark&MLLib：随机森林预测结果总是0

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >