替换使用Pandas的国家的名称

2024-04-24 13:37:57 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在开发一个熊猫数据框架,我想用另一个名称替换一些国家的名称。 这是我想替换的国家的名单

“大韩民国”:“韩国”, “美利坚合众国”:“美利坚合众国”, “大不列颠及北爱尔兰联合王国”:“联合王国”, “中国,香港特别行政区”:“香港”

我在代码中使用了pandas.DataFrame.replace, 这里是代码snnipet

import pandas as pd
import numpy as np
def answer_one():
    energy = pd.read_excel('Energy Indicators.xls',skip_footer=38, skiprows=17,parse_cols='C:F')
    cols=['Country', 'Energy Supply', 'Energy Supply per Capita', '% Renewable']
    energy.columns=cols
    energy[energy['Energy Supply'] == "..."]=np.NaN
    energy[['Energy Supply','Energy Supply per Capita']]=energy[['Energy Supply','Energy Supply per Capita']].apply(pd.to_numeric)
    energy['Energy Supply']=energy['Energy Supply']*10**6
    replace_dict={"Republic of Korea": "South Korea",
                  "United States of America": "United States",
                  "United Kingdom of Great Britain and Northern Ireland": "United Kingdom",
                  "China, Hong Kong Special Administrative Region": "Hong Kong"}
    energy['Country'].replace(to_replace=replace_dict, inplace=True)
    energy['Country'] = energy['Country'].str.extract('(^[a-zA-Z\s]+)', expand=False).str.strip()
    print(energy)

    return "ANSWER"
answer_one()

但是上面的代码不起作用。 以下是我正在处理的.xls文件: (https://docs.google.com/spreadsheets/d/15NVlu5IV_8g2SlxCHg5y2coMJ9Tw8jbtWc6_ItJkuXU/edit#gid=1525168449&range=J4) 提前准备好


Tags: of代码名称pandas国家countryreplaceunited