带条件的规范化级数

import pandas as pd df = pd.DataFrame({'key' : [111, 222, 333, 444, 555, 666, 777, 888, 999], 'score1' : [-1, 0, 2, -1, 7, 0, 15, 0, 1], 'score2' : [2, 2, -1, 10, 0, 5, -1, 1, 0]}) print(df) key score1 score2 0 111 -1 2 1 222 0 2 2 333 2 -1 3 444 -1 10 4 555 7 0 5 666 0 5 6 777 15 -1 7 888 0 1 8 999 1 0

1条回答

网友

1楼 · 发布于 2024-05-14 15:10:54

想法是将-1值转换为缺少的值：

cols = ['score1','score2']
df[cols] = df[cols].mask(df[cols] == -1)

x = df[cols].values
min_max_scaler = preprocessing.MinMaxScaler()
x_scaled = min_max_scaler.fit_transform(x)
df = df.join(pd.DataFrame(x_scaled, columns=cols).add_prefix('norm_'))
print (df)
   key  score1  score2  norm_score1  norm_score2
0  111     NaN     2.0          NaN          0.2
1  222     0.0     2.0     0.000000          0.2
2  333     2.0     NaN     0.133333          NaN
3  444     NaN    10.0          NaN          1.0
4  555     7.0     0.0     0.466667          0.0
5  666     0.0     5.0     0.000000          0.5
6  777    15.0     NaN     1.000000          NaN
7  888     0.0     1.0     0.000000          0.1
8  999     1.0     0.0     0.066667          0.0

相关问题更多 >

编程相关推荐

热门问题

热门文章

带条件的规范化级数

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >