替换python字符串中的特殊字母

2024-03-29 00:47:45 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在研究一个足球数据集,处理一些异国情调的名字。我想问一下如何替换数据集中存在的特殊字母表?以下是这些“异国”名字的一些例子:

“莱昂内尔·安德烈斯·梅西·库西蒂尼”、“内马尔·达席尔瓦·桑托斯小将”、“路易斯·阿尔贝托·苏亚雷斯·迪亚斯”、“大卫·德赫亚·金塔纳”、“兹拉坦·易卜拉希莫维奇”

特殊字母是é、á、ć、等(上面有“上标”的字母)。我想把它们改成“基本”形式-奇变成c,á变成a,依此类推。你知道吗

非常感谢!你知道吗


Tags: 数据字母名字大卫字母表形式例子足球
3条回答

你可以试试:

import unidecode
new_string = unidecode.unidecode(your_string)

您可以使用unidecode包:

import unidecode
special_str = [u'Lionel Andrés Messi Cuccittini', u'Neymar da Silva Santos Junior', u'Luis Alberto Suárez Díaz', u'David De Gea Quintana', u'Zlatan Ibrahimović']
for item in special_str:
    print(unidecode.unidecode(item))

输出为:

Lionel Andres Messi Cuccittini
Neymar da Silva Santos Junior
Luis Alberto Suarez Diaz
David De Gea Quintana
Zlatan Ibrahimovic

你可以试试这个

for i in range(len(playernames)):
    playernames[i] = playernames[i].replace("é", "e")

当然,再加上所有其他字符

相关问题 更多 >