假设我有一个字符串:
欧珑 无极乌龙 Atelier Cologne Oolang Infini, 2010
如何将其拆分为两个字符串的数组['欧珑 无极乌龙','Atelier Cologne Oolang Infini, 2010']
我试过:
names = re.split(r'([a-zA-Z]+)', names)
但它给出了:
names: ['欧珑 无极乌龙 ', 'Atelier', ' ', 'Cologne', ' ', 'Oolang', ' ', 'Infini', ', 2010']
Tags:
一个快速简单的正则表达式,用于区分拉丁和非拉丁部分(regex101 demo)
与
re.findall
(tio.run demo)一起使用。正则表达式是非常自我解释和匹配的[^a-z\d]+
{a3}字符,即not拉丁字母或数字[_a-z\d\W]+
一个或多个,即_
拉丁字母、数字或非word-characters虽然速度很快,但您需要从结果中删除空白。否则它会变得更复杂:)要区分拉丁语/非拉丁语,可以在结果中使用^{} 和groups(tio.run demo)
相关问题 更多 >
编程相关推荐