如何清理dataframe中值为“1012”（在范围内表示）的列？

1条回答

网友

1楼 · 发布于 2024-05-15 13:36:45

您可以尝试pd.get_dummies()，它将为不同的范围创建一个单独的列，将每个列标记为True（1）或False（0）。然后可以用它们来代替范围（这些范围被认为是分类数据）

import pandas as pd

data = [[10,"blue", "Ford"], [12,"green", "Chevy"],["10-12","white", "Chrysler"],["13-14", "red", "Subaru"]]
df = pd.DataFrame(data, columns = ["Fuel Economy city", "Color", "Make"])
print(df) 
df = pd.get_dummies(df)
print(df)

输出：

Fuel Economy city_10  Fuel Economy city_12  Fuel Economy city_10-12  \
0                     1                     0                        0   
1                     0                     1                        0   
2                     0                     0                        1   
3                     0                     0                        0   

Fuel Economy city_13-14  Color_blue  Color_green  Color_red  Color_white  \
0                        0           1            0          0            0   
1                        0           0            1          0            0   
2                        0           0            0          0            1   
3                        1           0            0          1            0   

Make_Chevy  Make_Chrysler  Make_Ford  Make_Subaru  
0           0              0          1            0  
1           1              0          0            0  
2           0              1          0            0  
3           0              0          0            1

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何清理dataframe中值为“1012”（在范围内表示）的列？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >