我正在学习Python/Pandas,其数据帧具有以下结构:
import pandas as pd
df = pd.DataFrame({'key' : [111, 222, 333, 444, 555, 666, 777, 888, 999],
'score1' : [-1, 0, 2, -1, 7, 0, 15, 0, 1],
'score2' : [2, 2, -1, 10, 0, 5, -1, 1, 0]})
print(df)
key score1 score2
0 111 -1 2
1 222 0 2
2 333 2 -1
3 444 -1 10
4 555 7 0
5 666 0 5
6 777 15 -1
7 888 0 1
8 999 1 0
score1
和score2
序列的可能值是-1
和所有正整数(包括0
)。你知道吗
我的目标是通过以下方式对两列进行规范化:
-1
,则返回缺少的NaN
值0
和1
之间对剩余的正整数进行规格化。你知道吗我不想覆盖原始序列score1
和score2
。相反,我想对这两个系列应用一个函数来创建两个新列(比如norm1
和norm2
)。你知道吗
我在这里读了几篇文章,建议使用sklearn预处理模块中的MinMaxScaler()
方法。我不认为这是我需要的,因为我需要一个额外的条件来处理-1
值。你知道吗
我想我需要的是一个具体的功能,我可以适用于这两个系列。我还熟悉了规范化的工作原理,但是在Python中实现这个函数时遇到了困难。任何额外的帮助都将不胜感激。你知道吗
想法是将
-1
值转换为缺少的值:相关问题 更多 >
编程相关推荐