我需要一个正则表达式来匹配所有企业家的名字。所以,我写了下一篇:
((?i)индивидуальный предприниматель|ип) [А-Я][а-я]+ [А-Я](\.|[а-я]+) [А-Я](\.|[а-я]+)
在文本中:
Индивидуальный предприниматель Шаладко Пётр Владиславович, именуемый в дальнейшем "Арендодатель". и индивидуальный предприниматель Сергеев Денис Александрович, действующий на основании Свидетельства, именуемый в дальнейшем "Арендатор", заключили настоящий договор о нижеследующем:
我的表达式只匹配一个条目:
индивидуальный предприниматель Сергеев Денис Александрович
忽略
Индивидуальный предприниматель Шаладко Пётр Владиславович
为什么会这样?我错过了哪里
俄语字母表包含33个字母,其中一个
ё
/Ё
,不属于а-я
和А-Я
范围。将它们添加到角色类:参见regex demo。我还使用非捕获组来提取只与
re.findall
匹配的完全匹配如果只需要提取名称,请使用捕获组(
([А-ЯЁ][а-яё]+ [А-ЯЁ](?:\.|[а-яё]+) [А-ЯЁ](?:\.|[а-яё]+))
)包装regex模式的该部分:见this regex demo
Python demo:
输出:
['Шаладко Пётр Владиславович', 'Сергеев Денис Александрович']
相关问题 更多 >
编程相关推荐