目标编码：填充在扩展平均编码值中生成的NaN

2024-05-16 21:32:30 发布

您现在位置：Python中文网/ 问答频道 /正文

633

网友

男 | 程序猿一只，喜欢编程写python代码。

我正在研究目标列中有五个类的多类分类问题。我使用扩展平均编码（目标编码）为分类变量生成了特征。该方法基于对分类变量值进行编码，每个值的目标变量的平均值。在

这也会导致一些NaN值，如“事务类型”列中的“平均值”列。在

填充这些NaN值的最佳方法是什么？我要加满吗这些带有列的意思。
我的编码意味着如何生成测试数据目标/因变量“投诉状态”不存在？

输入数据：

生成平均值编码：

def add_feat_mean_encoding(col_list):
    """
        Expanding mean encoding 
    """
    for i in col_list:
        cumsum = train.groupby(i)['Complaint-Status'].cumsum() - train['Complaint-Status']
        cumcnt = train.groupby(i).cumcount()
        train[i+'_mean_target'] = cumsum/cumcnt

cat_var = ['Transaction-Type','Complaint-reason','Company-response','Consumer-disputes']
add_feat_mean_encoding(cat_var)

Tags：方法 add 目标编码分类 train col nan

0条回答

目前没有回答

目标编码：填充在扩展平均编码值中生成的NaN

相关问题更多 >

编程相关推荐

热门问题

热门文章

目标编码：填充在扩展平均编码值中生成的NaN

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >