使用正则表达式匹配字符串的一部分？（Python）

3条回答

网友

1楼 · 编辑于 2024-05-14 16:22:42

您可以使用以下选项：

\s([^;\s]+)

Demo

捕获的组([^;\s]+)将包含所需的子字符串，后跟空格（\s）

>>> s = 'GENE_LIST: F59A7.7; T25D3.3; F13B12.4; cysl-1; cysl-2; cysl-3; cysl-4; F01D4.8'
>>> re.findall(r'\s([^;\s]+)', s)
['F59A7.7', 'T25D3.3', 'F13B12.4', 'cysl-1', 'cysl-2', 'cysl-3', 'cysl-4', 'F01D4.8']

网友

2楼 · 编辑于 2024-05-14 16:22:42

更新

其实要简单得多：

[^\s;]+

然而，首先使用substring只获取你需要的部分（基因，不包括GENELIST）

演示：regex demo

网友
3楼 · 编辑于 2024-05-14 16:22:42

给出：

>>> s="GENE_LIST: F59A7.7; T25D3.3; F13B12.4; cysl-1; cysl-2; cysl-3; cysl-4; F01D4.8"

可以使用Python字符串方法执行以下操作：

>>> s.split(': ')[1].split('; ')
['F59A7.7', 'T25D3.3', 'F13B12.4', 'cysl-1', 'cysl-2', 'cysl-3', 'cysl-4', 'F01D4.8']

对于正则表达式：

(?<=[:;]\s)([^\s;]+)

Demo

或者，在Python中：

>>> re.findall(r'(?<=[:;]\s)([^\s;]+)', s)
['F59A7.7', 'T25D3.3', 'F13B12.4', 'cysl-1', 'cysl-2', 'cysl-3', 'cysl-4', 'F01D4.8']

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用正则表达式匹配字符串的一部分？（Python）

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >