逻辑回归是创建评分模型的更好方法吗?

2024-06-07 15:49:48 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个用户详细信息的数据集,我想在其中为每个用户生成一个分数。在

所需的输出范围看起来像低、中、高。我正在进行后勤回归。在

这是处理这类问题的正确方法吗?在

有什么建议吗?在


Tags: 数据方法用户详细信息分数建议后勤
1条回答
网友
1楼 · 发布于 2024-06-07 15:49:48

回答你的问题:这是一个不错的模式-在大多数情况下建议-开始。在

更重要的问题是,在我看来,你应该问的是你拥有什么样的用户数据,以及它在所选模型下的表现如何:

  - data has a large number of features: you probably want to run a PCA, XGBOOST or another feature importance evaluation to separate useful features from noise features
  - you have a large amount of text data, i.e. logs: you might want to attach a naive Bayes, tf/idf or another model that performs well with text-based data
  - does your data tend to overfit when using model X? Maybe you want to do data engineering or try a different model

我给你的建议是先建立LR模型,看看它在你的列车/测试/预测数据集上的表现,并评估性能是否能满足你的需求,然后再考虑/讨论不同的模型/方法。在

相关问题 更多 >

    热门问题