SVR忽略了我数据集中的“离群值”,没有捕捉到更“极端”的值

2024-04-29 16:52:36 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用scikitlearn的SVR来根据一些参数来模拟教授的收入。其中一个参数是这样的:

enter image description here

我只显示其中一个参数,因为我不知道如何绘制多维图,但这解释了模型结果的混沌图。在

基本上,你看到的是SVR的产出只涵盖了中低档工资。这对我用来校准SVR的网格搜索的所有组合都是正确的。具体来说,我的栅格参数是:

epsilon_svr = [0.01, 0.1, 0.5, 1]
C_svr = [1,3,5]

我的问题是如何捕捉到高端,并显著改进我的模型,尤其是R^2。我知道SVR倾向于用于异常值检测,也有可能将这些点选为异常值,但如何提高模型拟合度呢。似乎对我那微不足道的7个参数进行详尽的网格搜索可能不足以完全捕获我的模型?在


Tags: 模型网格参数绘制高端栅格校准教授