正则表达式使字符串有意义。Python

2024-06-02 07:05:02 发布

您现在位置:Python中文网/ 问答频道 /正文

如何从字符串中删除非英语单词(词汇表)

例如:

puppies monitoring_string = c1299fe10ba49eb54f197dd4f735fcdc dogtime

如何删除所有非英语单词,保留词汇: 我想得到的结果是:

puppies monitoring string dogtime

或者

puppies monitoring string  ....or others

目的是使字符串有意义。你知道吗

我尝试的是:

re.sub('[^A-Za-z0-9]+', ' ', string)
result:   puppies monitoring string c1299fe10ba49eb54f197dd4f735fcdc dogtime

Tags: or词汇表字符串目的restring词汇monitoring
1条回答
网友
1楼 · 发布于 2024-06-02 07:05:02

想不出任何逻辑词语拥有非词语所没有的。你知道吗

首先,也许你可以试着删除带有数字的单词。你知道吗

正则表达式\w*\d\w*应该找到带有数字和数字的字母组合。你知道吗

相关问题 更多 >