我有一个这样的数据帧,叫做基于特征选择的测试:
Spin Seek Power
0 92 50 99
1 88 20 90
2 56 100 90
3 87 20 100
4 67 30 45
名为“hdd_new”的原始数据帧如下所示:
serial_number Spin Seek Power
0 W3015JSX 92 50 99
1 ZA10Q2F7 88 20 90
2 9VYC10JY 56 100 90
3 S301LJ5G 87 20 100
4 Z305D4X6 67 30 45
构建模型后,我决定在.csv文件中的新数据上测试它
df_test = hdd_new['serial_number']
y_pred = model.predict(test)
df_test['failure'] = y_pred
df_test[['serial_number','failure']].to_csv('predictions.csv', index=False)
df_test = pd.DataFrame(df_test)
df_test
输出:
serial_number
0 W3015JSX
1 ZA10Q2F7
2 9VYC10JY
3 S301LJ5G
4 Z305D4X6
failure [0,1,0,0,1]
我想要实现的目标:
serial_number failure
0 W3015JSX 0
1 ZA10Q2F7 1
2 9VYC10JY 0
3 S301LJ5G 0
4 Z305D4X6 1
我不知道我做错了什么。请帮忙
只需查看您共享的内容,而不了解模型的详细信息,您也许可以像这样重新组织代码
注意:除非
df_test
包含此场景中未包含的其他列,否则最后一行可以简单地读取:相关问题 更多 >
编程相关推荐