从字符串中删除unicode

2024-04-25 12:42:47 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图从阿拉伯语字符串中删除特殊字符,使用的是Unicode,我从这个链接获得: https://www.fileformat.info/info/unicode/char/0640/index.htm

这是我的代码:

TATWEEL = u"\u0640"
text = 'الســلام عليكــم'

text.replace(TATWEEL, '')
print(text)

但我试过了,但没用(它打印出相同的字符串而不删除字符)

这是一个特殊的角色“ـ”

enter image description here

我用的是Python3


Tags: 字符串代码texthttpsinfoindex链接www
2条回答

如果下面的regex可能包含多个unicode文本,则应该包含多个元素:

import re
TATWEEL = u"\u0640"
text = 'الســلام عليكــم'

unicode_removed_text = re.sub(TATWEEL, '', text)

strings的replace方法不会更改调用它的字符串;它返回一个替换了指定字符的新字符串。在

此代码执行您想要的操作:

TATWEEL = u"\u0640"
text = 'الســلام عليكــم'

text2 = text.replace(TATWEEL, '')
print(text2)

要获得预期的确切结果,请使用以下命令:

^{pr2}$

相关问题 更多 >

    热门问题