在sklearn中将文本列转换为数字

2条回答

网友

1楼 · 编辑于 2024-04-28 07:26:11

您可以使用分类数据类型将它们转换为整数代码。在

column = column.astype('category')
column_encoded = column.cat.codes

只要使用具有足够深的树的基于树的模型，例如GradientBoostingClassifier(max_depth=10），您的模型应该能够再次划分类别。在

网友

2楼 · 编辑于 2024-04-28 07:26:11

考虑使用标签编码-它通过为每个类别分配一个介于0和\u categories-1的num_之间的整数来转换分类数据：

from sklearn.preprocessing import LabelEncoder
df = pd.DataFrame(['a','b','c','d','a','c','a','d'], columns=['letter'])

  letter
0      a
1      b
2      c
3      d
4      a
5      c
6      a

申请：

^{pr2}$

编码序列：

编程相关推荐

java将Int值传递给另一个类
在使用Sdin（或非交互式）输入| Java时调试奇怪的输入错误
java返回一个文本字符串作为响应struts2
java为什么我们不能在声明局部变量之前初始化它呢？
java从现有XML中读取值并将其填充到Json中
java Spring Boot+Maven:找不到repositoryFactoryBean
java使用regex表示“W o.Rd”。replaceAll（“单词”、“替换”）
java Sub resorce在Jersey REST API框架中不起作用
java在组件启动时，当所述报告存储在Sharepoint中时，是否可以加载预格式化的WebDataRocks报告？
java并发更新列表的最佳方法

相关问题更多 >

编程相关推荐

热门问题

热门文章

在sklearn中将文本列转换为数字

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >