python statsmodel包的测试与验证

2024-04-26 21:03:07 发布

您现在位置:Python中文网/ 问答频道 /正文

我已经能够使用result = logit.fit()进行模型预测。在

现在对于测试和验证集,我们应该只做result.predict(test_df[features])和{}?就这些吗?还是我错过了一步?当我尝试为日常预测部署模型时,会有什么不同?在

我是新来的statsmodel,事实上从今天开始,时间不多。我查了几篇博客,信息都脱节了,所以只想确定一下。在

另外,有没有一种方法可以直接从statsmodel中提取'Area under ROC',而不是通过编码的方式?在


Tags: 方法模型test信息df部署时间area
1条回答
网友
1楼 · 发布于 2024-04-26 21:03:07

对于第一个问题,每个ML算法(树、logistic回归等)都有参数。为了寻找最佳的参数,我们训练了多个不同参数的模型,并保留了在验证数据集上给出最佳分数的模型(参数)。 现在,这个分数并不能让你知道在生产(预测)中,你用测试数据集上的最佳参数测试你的模型会得到什么样的分数,而这个最终的分数让你知道你的模型在生产中的表现。在

对于第二个问题,您可以使用skit learn,我在google上找到了这些示例http://www.programcreek.com/python/example/82598/sklearn.metrics.auc

相关问题 更多 >