Python中非英语语言的正则匹配
我正在尝试在一个Python脚本中捕捉和匹配俄语字符。因为俄语字符不在[a-Z]这个范围内,所以我应该用什么正则表达式来匹配它们呢?我不能用(.*)因为那样会匹配所有的东西。
linkpat = re.compile('name=[a-Z]+;size=[0-9]+')
3 个回答
0
使用字符类,这些字符类会根据地区的不同而有所变化。
1
你可以试试 \w
,并使用正确的 区域设置
5
使用unicode标志:
re.compile('name=\w+;size=\d+', re.U)
这样做的话,会匹配任何语言中的字母(还有下划线),不仅仅是俄语。