使用自定义映射函数转换原始分类特征

2024-06-12 13:20:39 发布

您现在位置:Python中文网/ 问答频道 /正文

正如我从文档here中了解到的,我可以使用类似tft.compute_and_apply_vocabulary(s)的调用来将分类列转换为数字特征

作为tensorflow的初学者,我想知道是否存在原始特征列到数字列的自定义映射?我已经看到描述的hash_bucket方法here几乎完成了我想要的工作。但是我需要调用一个自定义映射函数来代替散列,这样分类列中的'm'唯一元素映射到数值或字符串的'n'唯一元素,其中n<;m

用例。我在使用KDD CUP 99数据集的实验中遇到了这个问题,其中训练集的目标类包含23种不同的攻击类型,需要对它们进行识别并将其分为四类攻击。如果有一个转换函数我可以使用,以便所有23个唯一的元素在目标类可以映射到4类攻击编号[1,2,3,4]。包括一个可以映射到[0]的普通连接,目标类将包含5个类,因此我可以直接训练一个多类分类模型。关于KDD CUP 99数据集的更多信息是here

有人能帮忙吗

更新 在thread中的帮助下解决了此问题


Tags: and数据文档元素目标here分类数字