我有很多调查结果数据,有一个专栏问用户来自哪个州。例如,有些人写“VA”,有些人写“Virginia”
我本想用一本字典地图,但事情进展得不太顺利。有人对我有什么建议吗?我对Python还比较陌生,所以我仍在尝试掌握一些窍门。你知道吗
以下是我尝试过的:
abv = {"Virginia": "VA", "Maryland": "MD",
"West Virginia": "WV", "Pennsylvania": "PA"}
abv2 = dict(map(reversed, abv.items()))
survey['New State'] = survey.State.map(abv2)
survey
有些人打“弗吉尼亚”,有些人写“弗吉尼亚”。我只想要缩写版本。你知道吗
如果确实无法验证用户输入前端,则可以轻松使用字典的
get
方法,提供一个默认值作为回退:假设您的数据帧如下所示:
您构造的初始映射可以是较长形式名称到规范缩写的映射。你知道吗
然后,用缩写本身更新:
最后,调用
.map()
得到结果:值得说明的是:您的
to_abbrev
必须是一个完整的映射;否则,缺少的值将是NaN:正如评论中所建议的,毫无疑问,有一些库是专门为您构建更完整的映射的,考虑到常见的拼写错误和小的语法差异,例如“D.C.”和“DC.”
相关问题 更多 >
编程相关推荐