我有一个熊猫系列,其值如下:
Bachelors Degree 639
Diploma 291
O - Level 264
Masters Degree 149
Certificate 126
A - Level 69
PGD 40
Bachelors Degree 28
A-Level 20
O-Level 15
Masters 10
Bachelors 6
diploma 5
certificate 5
Ph.D 4
A- Level 2
Post Graduate Diploma 1
Msc Environment 1
BBA 1
O- Level 1
Masters 1
PhD 1
我从excel中获取数据
我想用pandas做数据清理,比如用硕士学位替换所有硕士学位的案例(我可以用excel做,但我正在学习pandas)
我试过了
mapp={"Bachelor's Degree":["Bachelors Degree","Bachelors","BBA","Bachelors Degree"],
"Ordinary Diploma":"diploma",
"Ordinary Level":["O - Level","O-Level","O- Level"],
"Master's Degree":["Masters Degree","Masters","Msc Environment","Masters"],
"Certificate":"certificate",
"Advanced Level":["A - Level","A-Level","- Level"],
"Post Graduate Diploma":["Post Graduate Diploma","PGD"],
"PHD":["Ph.D","PhD"]
}
df['EDUCATION_LEVEL']=df['EDUCATION_LEVEL'].map(mapp)
仅返回只有一个值的证书密钥的结果
似乎我不能使用列表作为字典键的值
任何关于如何替换这些值的建议都将受到高度赞赏。 罗纳德 这是实际数据在excel列中的显示方式。
我已经添加了一个列中数据的图像。 面临的挑战是如何取代“硕士学位”的各种变体
首先,通过将所有值设置为列表,对mapp dict进行轻微更改:
一个想法是将一个元素值转换为一个元素列表,如
"diploma"
到["diploma"]
:如果不可能,则使用:
相关问题 更多 >
编程相关推荐