基于有限特征的准确率预测

Available Drivers int64 Placed Time float64 Response Distance float64 Car Type int32 Day Of Week int64 Response Delay float64 Order Completion int32 [target]

model = tf.keras.models.Sequential([ tf.keras.layers.Dense(16, activation='relu', input_shape=input_shape), tf.keras.layers.Dense(16, activation='relu'), tf.keras.layers.Dropout(0.2), tf.keras.layers.Dense(1, activation='sigmoid') ]) adam_optimizer = tf.keras.optimizers.Adam(learning_rate=LEARNING_RATE) binary_crossentropy_loss = tf.keras.losses.BinaryCrossentropy() model.compile(optimizer=adam_optimizer, loss=binary_crossentropy_loss, metrics=['accuracy']) early_stop = tf.keras.callbacks.EarlyStopping(monitor='val_loss', patience=ES_PATIENCE) history = model.fit(train_dataset, validation_data=validation_dataset, epochs=EPOCHS, verbose=2, callbacks=[early_stop])

2条回答

网友

1楼 · 编辑于 2024-04-25 14:18:00

如果您正在进行分类，您可能需要研究集成方法（forest、boosts等）

如果你在计算概率，你可能想研究概率图形模型（贝叶斯网络等）

网友

2楼 · 编辑于 2024-04-25 14:18:00

当你提出这个问题时，这是一个典型的机器学习分类问题。你知道吗

给定N个特征（自变量），你必须预测1（一）个因变量。你知道吗

你构建神经网络的方法很好。你知道吗

因为你有一个二进制分类的问题，乙状结肠激活是正确的。你知道吗

关于模型的复杂性（层的数量，每层神经元的数量），这在很大程度上取决于数据集。你知道吗

如果你有一个全面的数据集，有很多的特征和例子（一个例子是数据框中的一行X1，X2，X3。。。Y），其中X是特征，Y是因变量，模型的复杂度可能会有所不同。你知道吗

如果您的数据集很小，但有一些特性，建议使用小型模型。总是从一个小模型开始。你知道吗

如果遇到拟合不足的问题（训练集以及验证和测试集的准确性较差），可以逐渐增加模型的复杂性（添加更多层，每层添加更多神经元）。你知道吗

如果遇到过拟合问题，实施正则化技术可能会有所帮助（退出、L1/L2正则化、噪声添加、数据增强）。你知道吗

你需要考虑的是，如果你有一个小的数据集，那么一个经典的机器学习算法可能会优于深度学习模型。这是因为神经网络非常“饥渴”->；与机器学习模型相比，它们需要更多的数据才能正常工作。您可以选择支持向量机/核支持向量机/随机森林/XGBoost和其他类似的算法。你知道吗

编辑！你知道吗

是否以及以何种准确度/概率自动将问题分为两部分，而不仅仅是简单的分类。你知道吗

我个人会做的是：由于概率发生在0%到100%之间，如果你在X列中有概率作为一个特征（你没有），那么，根据你拥有的数据点（行）的数量，你可以做以下事情：我会给每个概率部分指定一个标签：：1到（0%，25%），2到（25%，50%），3至（50%，75%），4至（75%，100%）。但这完全取决于先前的概率信息（如果将概率作为特征）。如果你推断得到标签3，你就会知道骑乘完成的概率。

否则，您不能将当前的问题同时定义为分类问题和概率问题。你知道吗

我希望我已经给你一个介绍性的见解。快乐的编码。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章