擅长:python、mysql、java
<p>新数据应该与用于训练和持久化原始模型的数据具有相同的列。如果新的数据中分类变量的唯一值的数量较少,请在完成后手动为这些变量添加列警察局的傻瓜()并将所有数据点的值设置为零。在</p>
<p>模型只有在获得所需的列数时才能工作。如果警察局的傻瓜无法在新数据上创建所有这些列,您应该手动创建。在</p>
<p>编辑</p>
<p>如果要在警察局的傻瓜()步骤,可以使用以下方法。
假设dfünewdata是应用后的数据帧警察局的傻瓜()tot the new dataset and df\u olddata是您应用时得到的数据警察局的傻瓜()在旧的数据集(用于培训)上,您只需执行以下操作:</p>
<pre><code>df_newdata = df_newdata.reindex(labels=df_olddata.columns,axis=1)
</code></pre>
<p>这将自动创建df_newdata中缺少的列(与df_olddata相比),并将所有行的这些列的值设置为NaN。所以现在,您的新dataframe具有与原始dataframe相同的exct列。在</p>
<p>希望这有帮助</p>