分类方差最小的Python箱子大小 - 问答 - Python中文网

分类方差最小的Python箱子大小

2024-04-19 20:25:12 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我想将我的特征“Age”从一个连续变量改为一个用于二进制分类的年龄范围的分类变量，如下所示：

df['Age'] = pd.cut(df['Age'], [0,6,12,16,65,90] ,labels=['0-6','6-12','12-16','16-65','65-90'])

不过，我希望以最佳方式对其进行拆分，以便可以最有效地对数据进行分类。i、 e年龄范围内的阶级差异最小化，而不是过度拟合。你知道吗

有没有一个软件包有这样一种方法，可以在这样拆分数据时最小化差异，还是我必须自己写一个？你知道吗

Tags：数据方法 df age labels 方式二进制分类

1条回答

网友

1楼 · 发布于 2024-04-19 20:25:12

也许你可以用sklearn.cluster来做这个。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章