处理要预测的元组中的分类值

2024-05-23 15:36:51 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用经过培训的sklearn模型构建一个API。我以.joblib格式保存了模型,并在进行预测之前将其加载到API后端。但问题是,我的数据包含分类列,在使用pandas库中的get_dummies()方法对这些分类列进行一次热编码之后,我训练了我的模型。我的API接收带有分类列值的JSON数据,而不进行任何编码。在通过模型之前,我应该如何对要预测的元组进行编码?有人能帮我吗?多谢各位

我使用的数据集在编码前后都有以下列:

之前:

Index(['age', 'sex', 'cp', 'trestbps', 'chol', 'fbs', 'restecg', 'thalach',
       'exang', 'oldpeak', 'slope', 'ca', 'thal'],
      dtype='object')

之后:

Index(['age', 'sex', 'trestbps', 'chol', 'fbs', 'restecg', 'thalach', 'exang','oldpeak', 'ca', 'cp_0', 'cp_1', 'cp_2', 'cp_3', 'thal_0',
       'thal_1', 'thal_2', 'thal_3', 'slope_0', 'slope_1', 'slope_2'],
      dtype='object')

Tags: 数据模型api编码ageindex分类cp