我正在使用经过培训的sklearn模型构建一个API。我以.joblib格式保存了模型,并在进行预测之前将其加载到API后端。但问题是,我的数据包含分类列,在使用pandas
库中的get_dummies()
方法对这些分类列进行一次热编码之后,我训练了我的模型。我的API接收带有分类列值的JSON数据,而不进行任何编码。在通过模型之前,我应该如何对要预测的元组进行编码?有人能帮我吗?多谢各位
我使用的数据集在编码前后都有以下列:
之前:
Index(['age', 'sex', 'cp', 'trestbps', 'chol', 'fbs', 'restecg', 'thalach',
'exang', 'oldpeak', 'slope', 'ca', 'thal'],
dtype='object')
之后:
Index(['age', 'sex', 'trestbps', 'chol', 'fbs', 'restecg', 'thalach', 'exang','oldpeak', 'ca', 'cp_0', 'cp_1', 'cp_2', 'cp_3', 'thal_0',
'thal_1', 'thal_2', 'thal_3', 'slope_0', 'slope_1', 'slope_2'],
dtype='object')
在你把你的傻瓜弄上电脑后试试这个
df.reindex(columns=features, fill_value=0)
其中
features
是功能名称的列表相关问题 更多 >
编程相关推荐