计算两对X和y的相似性的最佳实践是什么

2022-07-06 11:26:25 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一些关于一个元素的值。例如,element1: values1, values2。 对于每个元素,我需要计算给定数量的特性的“分数”。 假设我们有一个特征,表示为:

  • 功能1的高分由value1的高分和value2的低分给出

因此,如果我假设value1(1)的高分和value2(0)的低分对应“feature1”的高分,那么计算作为value1和value2两个不同分数的feature1分数的最佳实践是什么?(例如,value1=0.7,value=0.2)。 我使用Python作为编程语言,我更喜欢使用sklearn ad模块,但所有适合的解决方案都被接受


Tags: 功能元素数量value特征特性分数value1value2feature1values2values1element1高分低分
1条回答
网友
1楼 ·
  1. 首先,规范化您的数据。标准化的一种类型是使值1、值2适合范围[0,1]
  2. 假设基于规范化数据的特征1的平均2值特征为(.7、.2)。对于任何新的2值(x,y),计算(x,y)和(.7,.2)之间的距离

在机器学习中计算距离时,通常不计算sqrt分量

dist^2 = (x-.7)^2 + (y-.2)^2

您可能还对计算2值(x,y)w.r.t到(.7,.2)的误差感兴趣,并且可以研究分类交叉熵