删除重复字符后的Python逐字匹配列表

2024-04-25 11:52:55 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个带有积极和消极情绪的单词列表,例如['happy', 'sad']

现在在处理tweet时,我删除了这样的重复字符(只允许2次重复):

happpppyyy -> happyy

saaad -> saad

检查例如saad是否是单词列表的一部分现在应该返回True,因为它类似于sad。你知道吗

我如何实现这种行为?你知道吗


Tags: true列表字符单词tweethappysadsaad
1条回答
网友
1楼 · 发布于 2024-04-25 11:52:55

我会动态地构建正则表达式:

happy

进入

h+a+p+p+y+

把一张“快乐”字的单子传给这个人:

import re

re_list = [re.compile("".join(["{}+".format(c) for c in x])) for x in ['happy', 'glad']]

然后测试它(使用any返回True如果任何快乐正则表达式匹配:

for w in ["haaappy","saad","glaad"]:
    print(w,any(re.match(x,w) for x in re_list))

结果:

haaappy True
saad False
glaad True

相关问题 更多 >