特征分布不同时的机器学习的尺度特征向量

2024-05-16 14:51:48 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试缩放我的特征向量以得到一个算法。我有3个特性和1个目标变量。 特征一:呈类高斯分布 特征2:倾斜,y值随着x的增加而减小。 特点三:高度倾斜。几乎所有的值都是相同的。 目标变量:高度倾斜。你知道吗

我的问题是:我想对特性和目标变量进行MinMaxScaling。可以缩放所有的特征还是倾斜的特征。你知道吗

功能1:enter image description here

功能2:enter image description here

功能3:enter image description here

目标变量类似于功能3。 因为我的Feature3和目标变量的数据大部分是稀疏的,所以有什么替代MinMaxScaling的方法吗?你知道吗

另外,是否可以根据相应列的分布对训练数据使用不同的定标器?如果问题不清楚,我很乐意提供更多信息:)


Tags: 数据方法功能算法信息目标高度特征
1条回答
网友
1楼 · 发布于 2024-05-16 14:51:48

现在,您不应该直接应用MinMaxScaling,因为features 2&3每次都非常接近于0,您无法从中学习。我习惯的做法是,在应用MinMaxScaling/StandardScaling之前,在这些特性上应用一个日志。这对于功能2应该很好,但是对于功能3,也许你应该考虑做一个日志(log(x)),但是我从来没有尝试过。你可能会失去太多的变化。我很想看看功能3的柱状图和一个或两个嵌套的日志。你知道吗

希望对你有帮助, 尼古拉斯

相关问题 更多 >