我是ML领域的新手。我正在努力学习预处理
我有一个结果数据,有四种类型的输入:0,1,2,3,4
0对应于无疾病,而1到4对应于不同类型的疾病
我希望将它们二元化为两个:0表示“无疾病”,1-4表示“有疾病”
我的代码:
binarize_outcome['Outcome']=pd.cut(outcome_variable['Outcome'], bins=[0,1,4], labels=["no heart disease","heart diseases"])
binarize_outcome
输出:
0 NaN
1 no heart disease
2 no heart disease
3 NaN
4 NaN
...
299 no heart disease
300 no heart disease
301 no heart disease
302 NaN
Outcome 0 NaN
1 heart disease...
Name: Outcome, Length: 304, dtype: object
如您所见,这不是我期望的输出,因为我的代码将0标记为NaN,而其余的标记不正确
希望你能帮我弄清楚这部分
提前感谢,, 艺术
您的条件是二进制的,因此可以从} :
numpy
使用^{或与来自} 一起:
pandas
的^{与^{} 的结果相同:
相关问题 更多 >
编程相关推荐