如何使用Pandas替换相同的数据字符串的含义(但类型不同),并将数字中的次要字符串转换为主要字符串

2024-04-25 00:45:20 发布

您现在位置:Python中文网/ 问答频道 /正文

比如说,

我有一个具有许多属性的大型数据集。假设其中一列是带有20个标签的占领列。让我们拿一个标签,一副工程师

由于数据集是结构化的,并且由于数据收集的性质,职业一副工程师将以多种形式出现,如“第一办公室工程师”、“第一副工程师”

我的问题是,对于我来说,用Python将所有一副工程师(包括其他版本)重命名为一个通用版本的最佳方法是什么。谢谢大家!


1条回答
网友
1楼 · 发布于 2024-04-25 00:45:20

首先,您可以创建字典,如下所示:

di = {"First Office Engineer": "1st Officer Engineer", "1st Off. Engineer": "1st Officer Engineer", "1st Officer Engineer":"1st Officer Engineer"}

并简单映射熊猫中的值:

df.test.map(di)

在哪里

test

是列的名称

相关问题 更多 >