用于删除非unicode字符的Python正则表达式

2024-06-16 16:39:15 发布

您现在位置:Python中文网/ 问答频道 /正文

我尝试使用python正则表达式从字符串中删除一些看起来像非unicode的字符。 这是我的代码:

xxx='Juliana Gon\xe7alves Miguel'
t=re.sub('\w*','',xxx)
t

结果是:

^{pr2}$

我要删除的是\xe7。 谁能有什么想法吗?在


Tags: 字符串代码reunicode字符xxxxe7gon
1条回答
网友
1楼 · 发布于 2024-06-16 16:39:15

如果期望的输出是

'Juliana Gonalves Miguel'

那么下面的正则表达式就可以做到了。在

re.sub('(?![ -~]).', '', xxx)

[ -~]:所有ASCII字符的简短可读版本

(?!):消极展望

相关问题 更多 >