2024-05-29 04:45:29 发布
网友
我有一个表,其列对应于教育级别:"phd", "undergrad",等等
"phd", "undergrad"
我想将这些特性改为0, 1, 2....。为了将数据作为机器学习算法的输入。在
0, 1, 2....
在Python中有没有一种方法可以自动将这些字符串特征映射到整数?在
你可能不想把数据输入机器学习算法——例如,如果博士学位是2分,硕士学位是1分,这是否意味着博士学位是原来的两倍?您可以使用“一个热编码”并创建一个可以输入的二进制矩阵(即1和0)。在
有多个库可以做到这一点,即一个这样的库:http://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.OneHotEncoder.html
祝你好运!在
BA MS PHD Person A 0 0 0 Person B 1 0 0 Person C 0 0 1 ...
如果您想要相同的序列顺序,可以使用^{}。在
lista = [ "phd", "undergrad", "etc"] >>> [i for i in enumerate(lista)] [(0, 'phd'), (1, 'undergrad'), (2, 'etc')]
这叫字典。像这样:
edu_level = { "phd": 0; "master": 1; "undergrad":2, ... }
查找如何使用字典,也许使用键“Python字典教程”。在
你可能不想把数据输入机器学习算法——例如,如果博士学位是2分,硕士学位是1分,这是否意味着博士学位是原来的两倍?您可以使用“一个热编码”并创建一个可以输入的二进制矩阵(即1和0)。在
有多个库可以做到这一点,即一个这样的库:http://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.OneHotEncoder.html
祝你好运!在
如果您想要相同的序列顺序,可以使用^{} 。在
这叫字典。像这样:
查找如何使用字典,也许使用键“Python字典教程”。在
相关问题 更多 >
编程相关推荐