如何在没有交叉验证的情况下检验机器学习的准确性

网友

1楼 · 编辑于 2024-04-26 08:45:50

不必一直对数据进行75 | 25分割。75 |25岁现在算是老派了。这在很大程度上取决于您拥有的数据量。例如，如果你有10亿个句子用来训练一个语言模型，就不必为测试预留25%的时间。你知道吗

另外，我支持前面的答案，尝试K-折叠交叉验证。作为补充说明，您可以考虑查看其他指标，如精确度和召回率。你知道吗

网友

2楼 · 编辑于 2024-04-26 08:45:50

分割数据对于评估至关重要。如果不扩展数据集，就不可能在100%的数据上训练模型并获得正确的评估精度。我的意思是，你可以改变你的训练/测试划分，或者尝试用其他方式优化你的模型，但我猜你的问题的简单答案是否定的

网友

3楼 · 编辑于 2024-04-26 08:45:50

根据您的要求，您可以试试K Fold Cross Validation。如果你把它分成90 | 10，也就是说用于火车测试。
要获得100%的数据进行培训是不可能的，因为你必须测试数据，然后只有你才能验证你的模型有多好。K Fold CV在每一次折叠中都会考虑整个列车数据，并从列车数据中随机抽取测试数据样本。
最后通过对所有折叠进行求和来计算精度。最后你可以用10%的数据来测试准确度。更多你可以阅读here和here

K Fold Cross Validation

Skearn提供了执行K折叠交叉验证的简单方法。只需在方法中不传递任何折叠。但是记住，褶皱越多，训练模型就需要更多的时间。更多您可以查看here

相关问题更多 >

编程相关推荐

热门问题

热门文章