将字符串列表转换为int列表以进行机器学习

2024-05-29 04:45:29 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个表,其列对应于教育级别:"phd", "undergrad",等等

我想将这些特性改为0, 1, 2....。为了将数据作为机器学习算法的输入。在

在Python中有没有一种方法可以自动将这些字符串特征映射到整数?在


Tags: 数据方法字符串算法机器整数特征特性
3条回答

你可能不想把数据输入机器学习算法——例如,如果博士学位是2分,硕士学位是1分,这是否意味着博士学位是原来的两倍?您可以使用“一个热编码”并创建一个可以输入的二进制矩阵(即1和0)。在

有多个库可以做到这一点,即一个这样的库:http://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.OneHotEncoder.html

祝你好运!在

         BA MS PHD
Person A  0  0  0
Person B  1  0  0
Person C  0  0  1
...

如果您想要相同的序列顺序,可以使用^{}。在

lista = [ "phd", "undergrad", "etc"]
>>> [i for i in enumerate(lista)]
[(0, 'phd'), (1, 'undergrad'), (2, 'etc')]

这叫字典。像这样:

edu_level = {
    "phd": 0;
    "master": 1;
    "undergrad":2, 
    ...
}

查找如何使用字典,也许使用键“Python字典教程”。在

相关问题 更多 >

    热门问题