如何为变量的值指定标签

2024-04-19 14:17:45 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个基本的数据集,其中一个变量表示加州的一个县。这是一个连续变量,1是按字母顺序排列的第一个县,58是按字母顺序排列的最后一个县。你知道吗

例如:

ID      County  
1         1  
2         58  
3         5  
4         43  
5         2  
6         19  
7         42  
8         2  
9         1  
10        14  

在Stata,我会做以下工作:

label define county_label 1 "Alameda" 2 "Alpine" 3 "Amador" 58 "Yuba"  
label val county county_label

接下来,使用tabulate命令我得到以下输出:

ID      County  
1         Alameda  
2         Yuba  
3         Calaveras  
4         Santa Clara  
5         Alpine  
6         Los Angeles  
7         Santa Barbara  
8         Alpine  
9         Alameda  
10        Inyo  

在Python中,我尝试创建字典作为第一步:

county_dictionary = {1 : 'Alameda', 2 : 'Alpine', ......  58 : 'Yuba'}  

然而,在这之后,我完全迷路了;我甚至不确定这是否必要。你知道吗

如何在Python中获得相同的输出?你知道吗


Tags: 数据id字母valsantalabel我会county
1条回答
网友
1楼 · 发布于 2024-04-19 14:17:45

试试这个:

df['County'] = df.apply(lambda x: county_dictionary.get(x['County'], 'Unknown'), axis=1)

相关问题 更多 >