擅长:python、mysql、java
<p>我可以使用下面列出的步骤来估算分类变量。我很乐意接受任何可以自动执行这些任务的遗漏或程序</p>
<p>步骤1:将对象的数据类型(全部)子集到另一个容器中</p>
<p>步骤2:将<code>np.NaN</code>更改为对象数据类型,例如<code>None</code>。现在,容器只由<code>objects</code>数据类型组成</p>
<p>步骤3:将整个容器更改为分类数据集</p>
<p>步骤4:对数据集进行编码(我正在使用.cat.codes)</p>
<p>步骤5:将编码的<code>None</code>值改回<code>np.NaN</code></p>
<p>步骤5:使用KNN(来自fancyicompute)来估算缺失的值</p>
<p>步骤6:将编码的数据集重新映射到其初始名称</p>