我们可以在数据帧上的操作符链接中添加用户定义的函数吗？

energy = (pd.read_excel('Energy Indicators.xls',skiprows=17, skip_footer=0,na_values='...') .drop(['Unnamed: 0','Unnamed: 1'], axis=1) .rename(columns = {'Unnamed: 2' : 'Country','Petajoules' : 'Energy Supply','Gigajoules' : 'Energy Supply per Capita', '%' : '% Renewable'}) .replace({'Country':{"Republic of Korea": "South Korea", "United States of America": "United States", "United Kingdom of Great Britain and Northern Ireland": "United Kingdom", "China, Hong Kong Special Administrative Region3": "Hong Kong"}}) .head(227))

3条回答

网友

1楼 · 编辑于 2024-04-26 10:42:00

IIUC最后一步应该是apply，如果需要对df的每一列使用lambda函数：

.apply(lambda x : ' '.join([re.sub('[^A-Za-z]','',w) for w in x.split()]), axis=1)

网友

2楼 · 编辑于 2024-04-26 10:42:00

您可以执行以下操作。。你知道吗

# for single elements
def keep_alphabets_elem(s):
    return ' '.join([re.sub('[^A-Za-z]','',w) for w in s.split()]))

energy = (pd.read_excel('Energy Indicators.xls',skiprows=17, skip_footer=0,na_values='...')
  .drop(['Unnamed: 0','Unnamed: 1'], axis=1)
  .rename(columns = {'Unnamed: 2' : 'Country','Petajoules' : 'Energy Supply','Gigajoules' : 'Energy Supply per Capita',
                      '%' : '% Renewable'})
  .replace({'Country':{"Republic of Korea": "South Korea",
                       "United States of America": "United States",
                       "United Kingdom of Great Britain and Northern Ireland": "United Kingdom",
                       "China, Hong Kong Special Administrative Region3": "Hong Kong"}})
  .apply(lambda x: keep_alphabets_elem(x['COL_NAME'], axis=1) # NEW
  .head(227))

请注意，需要使用axis=1对行而不是列执行此操作。你知道吗

网友

3楼 · 编辑于 2024-04-26 10:42:00

如果只想修改一个名为'col'的列：

.assign(col=energy['col'].map(func))

其中func是您定义的lambda函数：

def func(x):
    return ' '.join([re.sub('[^A-Za-z]','',w) for w in x.split()])

如果要将列名放入变量name='col'：

.assign(**{name: energy[name].map(func)})

相关问题更多 >

编程相关推荐

热门问题

热门文章