2024-04-26 09:52:56 发布
网友
我正在做一个任务,在这个任务中,我必须应用机器学习来根据用户的行为和背景对他们进行聚类。虽然我拥有的一些属性是数字的,但大多数是绝对的。你知道吗
我读到的大多数机器学习算法都只使用数值属性来处理数据。你知道吗
是否存在以分类属性作为输入的聚类算法?你知道吗
如果没有,如何将分类属性转换为数字属性?你知道吗
可以将分类特征转换为指标变量(也称为虚拟变量)。也可以使用one hot encoder。你知道吗
示例: 假设数据中有一个类型特征。它有三类。你知道吗
data = pd.DataFrame(['A','B','C'],columns=['TYPE']) data Out[24]: TYPE 0 A 1 B 2 C #Use get_dummies on pandas dataframe. new_data = pd.get_dummies(data,columns=['TYPE'],prefix='TYPE_') new_data Out[26]: TYPE__A TYPE__B TYPE__C 0 1.0 0.0 0.0 1 0.0 1.0 0.0 2 0.0 0.0 1.0
可以将分类特征转换为指标变量(也称为虚拟变量)。也可以使用one hot encoder。你知道吗
示例: 假设数据中有一个类型特征。它有三类。你知道吗
相关问题 更多 >
编程相关推荐