如何从字符串中删除非英语单词(词汇表)
例如:
puppies monitoring_string = c1299fe10ba49eb54f197dd4f735fcdc dogtime
如何删除所有非英语单词,保留词汇: 我想得到的结果是:
puppies monitoring string dogtime
或者
puppies monitoring string ....or others
目的是使字符串有意义。你知道吗
我尝试的是:
re.sub('[^A-Za-z0-9]+', ' ', string)
result: puppies monitoring string c1299fe10ba49eb54f197dd4f735fcdc dogtime
想不出任何逻辑词语拥有非词语所没有的。你知道吗
首先,也许你可以试着删除带有数字的单词。你知道吗
正则表达式
\w*\d\w*
应该找到带有数字和数字的字母组合。你知道吗相关问题 更多 >
编程相关推荐