如何拆分具有不同格式和分隔符的姓名列

Name_old Language New_Name Phillipe, Mr Johnson English Mr Johnson Phillipe 李, Mr 永 Mandarin Mr 永李 김두한.Kim Do Han Korean Kim Do Han Amori, Shinji/ あもりさせる / 由紀 Japanese Shinji Amori

splitname = df1["Name_old"].str.split(",", n = 1, expand = True) # create first name column based on values after comma in Name_old column df1["First_Name"]= splitname[1] # create first name column based on values before comma in Name_old column df1["Last_Name"]= splitname[0] #concatenate the first name and last name df1['New_Name'] = df1['First_Name'] +' '+ df1['Last_Name']

2条回答

网友

1楼 · 编辑于 2024-05-14 22:52:29

一种方法是根据Language的条件使用np.select：

d = {"Name":["Phillipe, Mr Johnson","李, Mr 永","김두한.Kim Do Han","Amori, Shinji/ あもりさせる / 由紀"],
     "Language":["English","Mandarin","Korean","Japanese"]}

df = pd.DataFrame(d)

df["new"] = np.select([df["Language"].isin(["English", "Mandarin"]),
                       df["Language"].eq("Korean")],
                     [df["Name"].str.split(",", n = 1).str[::-1].str.join(" "),
                      df["Name"].str.findall(r"[A-Za-z]+").str.join(" ")],
                     df["Name"].str.findall(r"[A-Za-z]+").str[::-1].str.join(" "))

print (df)

#
                         Name  Language                   new
0        Phillipe, Mr Johnson   English   Mr Johnson Phillipe
1                     李, Mr 永  Mandarin                Mr 永 李
2              김두한.Kim Do Han    Korean            Kim Do Han
3  Amori, Shinji/ あもりさせる / 由紀  Japanese          Shinji Amori

网友

2楼 · 编辑于 2024-05-14 22:52:29

可以使用正则表达式拆分字符串：

import re

test_str = 'a,b.c/d,e,f.g/hij.k'

print(re.split(r'[,\/.]', test_str))

r'[,\/.]'表示三者中任意一个的字符串：,、/或. 输出为：

['a', 'b', 'c', 'd', 'e', 'f', 'g', 'hij', 'k']

完整示例：

import re
import pandas as pd

test_str = 'abc,def'

df = pd.DataFrame({"old_name": [test_str]})

def split_name(name):
    split_name = re.split(r'[,\/.]', test_str)
    return split_name[0], split_name[1]

df['first_name'], df['last_name'] = zip(*df['old_name'].apply(split_name))

print(df)

输出：

  old_name first_name last_name
0  abc,def        abc       def

相关问题更多 >

编程相关推荐

热门问题

热门文章