2024-06-16 16:39:15 发布
网友
我尝试使用python正则表达式从字符串中删除一些看起来像非unicode的字符。 这是我的代码:
xxx='Juliana Gon\xe7alves Miguel' t=re.sub('\w*','',xxx) t
结果是:
我要删除的是\xe7。 谁能有什么想法吗?在
如果期望的输出是
'Juliana Gonalves Miguel'
那么下面的正则表达式就可以做到了。在
re.sub('(?![ -~]).', '', xxx)
[ -~]:所有ASCII字符的简短可读版本
[ -~]
(?!):消极展望
(?!)
如果期望的输出是
那么下面的正则表达式就可以做到了。在
[ -~]
:所有ASCII字符的简短可读版本(?!)
:消极展望相关问题 更多 >
编程相关推荐