用（有意的）困难字符清除字符串

2条回答

网友

1楼 · 编辑于 2024-05-13 22:51:23

尝试使用非严格错误行为^{}，即：

codecs.decode('string', 'utf8', 'ignore')

但是，这将为您提供一个unicode字符串。要将其转换为以前的字节字符串格式，只需使用解码字符串的.encode方法。你知道吗

网友

2楼 · 编辑于 2024-05-13 22:51:23

如果要从字符串中删除某些字符，只需迭代该字符串并跳过不需要的字符，然后重新连接各个字符。你知道吗

假设您的unicode字符串名为ustr，您可以使用：

u''.join([ c for ustr in a if c not in u'\00'])

（如果以后要删除其他字符，请说\01将它们添加到不在部分：...not in u'\00\01')

这应该对python2.x和3.x都适用

如果要删除第一个\00之后的所有内容，只需在原始字符串中find：

ix = ustr.find(u'\00')
filtered = ustr if ix == -1 else ustr[:ix]