我正在尝试缩放我的特征向量以得到一个算法。我有3个特性和1个目标变量。
特征一:呈类高斯分布
特征2:倾斜,y值随着x的增加而减小。
特点三:高度倾斜。几乎所有的值都是相同的。
目标变量:高度倾斜。你知道吗
我的问题是:我想对特性和目标变量进行MinMaxScaling。可以缩放所有的特征还是倾斜的特征。你知道吗
功能1:
功能2:
功能3:
目标变量类似于功能3。
因为我的Feature3和目标变量的数据大部分是稀疏的,所以有什么替代MinMaxScaling的方法吗?你知道吗
另外,是否可以根据相应列的分布对训练数据使用不同的定标器?如果问题不清楚,我很乐意提供更多信息:)
Tags:
现在,您不应该直接应用MinMaxScaling,因为features 2&3每次都非常接近于0,您无法从中学习。我习惯的做法是,在应用MinMaxScaling/StandardScaling之前,在这些特性上应用一个日志。这对于功能2应该很好,但是对于功能3,也许你应该考虑做一个日志(log(x)),但是我从来没有尝试过。你可能会失去太多的变化。我很想看看功能3的柱状图和一个或两个嵌套的日志。你知道吗
希望对你有帮助, 尼古拉斯
相关问题 更多 >
编程相关推荐