在Python中从字符串中移除特定字符

715 投票
27 回答
1849519 浏览
提问于 2025-04-16 05:31

我正在尝试用Python从一个字符串中去掉特定的字符。这是我现在使用的代码。不过,遗憾的是,它似乎对这个字符串没有任何作用。

for char in line:
    if char in " ?.!/;:":
        line.replace(char,'')

我该怎么做才能正确地去掉这些字符呢?


请查看 为什么调用字符串的方法(比如 .replace 或 .strip)不会修改字符串? 以了解这个方法有什么问题。这里的回答主要集中在如何解决这个问题。

27 个回答

65

在编程中,有时候我们会遇到一些问题,可能是因为代码写得不够清晰,或者是我们对某些概念理解得不够透彻。比如说,有人可能在使用某个功能时,发现它的表现和预期不一样,这时候就需要仔细检查代码,看看是不是哪里出了问题。

另外,编程的世界里有很多不同的工具和语言,每种都有自己的特点和用法。对于初学者来说,了解这些工具的基本用法是非常重要的,这样才能更好地解决问题。

总之,编程就像是解谜游戏,有时候需要耐心和细心去找出答案。遇到困难时,可以寻求帮助,或者查阅相关资料,慢慢积累经验。

>>> line = "abc#@!?efg12;:?"
>>> ''.join( c for c in line if  c not in '?:!/;' )
'abc#@efg12'
341

我是不是理解错了,还是说其实就是下面这个意思:

string = "ab1cd1ef"
string = string.replace("1", "") 

print(string)
# result: "abcdef"

把它放进一个循环里:

a = "a!b@c#d$"
b = "!@#$"
for char in b:
    a = a.replace(char, "")

print(a)
# result: "abcd"
773

在Python中,字符串是不可变的,也就是说它们不能被直接修改。因此,当你使用line.replace(...)时,它实际上是创建了一个新的字符串,而不是改变原来的那个。为了让line这个变量使用新的值(即去掉了某些字符的字符串),你需要重新绑定(赋值)它。

另外,你现在的做法相对来说会有点慢。而且,对于有经验的Python程序员来说,这种写法可能会让他们感到困惑,因为他们会看到一个双重嵌套的结构,可能会以为这里面有更复杂的逻辑。

从Python 2.6及更新的Python 2.x版本开始,你可以使用str.translate,(见下面的Python 3答案):

line = line.translate(None, '!@#$')

或者使用正则表达式替换,使用re.sub

import re
line = re.sub('[!@#$]', '', line)

方括号中的字符构成了一个字符类。在line中,属于这个类的任何字符都会被sub的第二个参数替换成:一个空字符串。

Python 3答案

在Python 3中,字符串是Unicode格式的。你需要稍微不同的方式来处理。kevpie在某个答案的评论中提到过这一点,文档中也有说明关于str.translate的内容。

当你调用Unicode字符串的translate方法时,不能像之前那样传递第二个参数。你也不能把None作为第一个参数传入。相反,你需要传入一个翻译表(通常是一个字典)作为唯一的参数。这个表将字符的序号值(也就是调用ord得到的结果)映射到应该替换它们的字符的序号值,或者——对我们来说很有用——用None表示这些字符应该被删除。

所以,要对Unicode字符串进行上述操作,你可以调用类似下面的代码:

translation_table = dict.fromkeys(map(ord, '!@#$'), None)
unicode_line = unicode_line.translate(translation_table)

这里使用了dict.fromkeysmap来简洁地生成一个包含

{ord('!'): None, ord('@'): None, ...}

更简单的是,正如另一个答案所说,可以直接在代码中创建翻译表:

unicode_line = unicode_line.translate({ord(c): None for c in '!@#$'})

或者,正如Joseph Lee提到的,使用str.maketrans来创建相同的翻译表:

unicode_line = unicode_line.translate(str.maketrans('', '', '!@#$'))

* 为了与早期版本的Python兼容,你可以创建一个“空”翻译表来替代None

import string
line = line.translate(string.maketrans('', ''), '!@#$')

这里使用string.maketrans来创建一个翻译表,这个表就是一个包含序号值从0到255的字符的字符串。

撰写回答