如何从诸如“0xd46b6c46a37f4578”或“jrLJW PUNtTLrQGZ25X4DA”python之类的字符串中删除异常单词

2024-04-25 02:09:18 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个字符串,其中包含适当的话和一些胡言乱语,这是没有任何意义的读者。我想把那些不正常的词从字符串中去掉。请注意,这些只是示例词,字符串中有大量的示例词。 示例:

0xe933b1dfab45d591 0xe7d363050cec0146
0xf5e4005d43867c48 0x1e0b75e9dff872f5
0xa46406ec8a4e6cdc 0x3ea14cfd28ccf8fe
0x750b065d3715b1c8 0x6bb50ebe411dd5da
0xd46b6c46a37f4578 0x15b9290f631cded2
0xafcfd4f9daa2187e 0x9dcc5dbad77c926a AEj_0IB_BpqtlN76JnAdUQ0gWWYXEzVQrFBrGQ 0ahUKEwjj09PGppLeAhXUZSsKHZltBc8Q61gI1QIoBzAF

我删除了额外的字符,如+,-,'使用如下:

text = re.sub(r'[^\w]', ' ', text)

但我找不到删除这些字符的方法。需要帮助。 谢谢。你知道吗


Tags: 方法字符串textre示例字符意义读者
1条回答
网友
1楼 · 发布于 2024-04-25 02:09:18

这对你有用吗?你知道吗

newtext = ""
    for word in text.split():
       if not(any(char.isdigit() for char in word) and any(char.isalpha() for char in word)):
           newtext += word + " "

这将检查文本中由空格分隔的字符串是否同时包含字母和数字。如果没有,它会把它们放进一个新的字符串中。你知道吗

相关问题 更多 >