Python中非英语语言的正则匹配

3 投票
3 回答
2958 浏览
提问于 2025-04-16 10:35

我正在尝试在一个Python脚本中捕捉和匹配俄语字符。因为俄语字符不在[a-Z]这个范围内,所以我应该用什么正则表达式来匹配它们呢?我不能用(.*)因为那样会匹配所有的东西。

linkpat = re.compile('name=[a-Z]+;size=[0-9]+')

3 个回答

0

使用字符类,这些字符类会根据地区的不同而有所变化。

1

你可以试试 \w,并使用正确的 区域设置

5

使用unicode标志:

re.compile('name=\w+;size=\d+', re.U)

这样做的话,会匹配任何语言中的字母(还有下划线),不仅仅是俄语。

撰写回答