我有以下形式的字符串:
}# => 2[1 HMDB00001 ,2 HMDB00002]
}# => 5[1 HMDB00001 ,2 HMDB00002, 3 HMDB00003 ,4 HMDB00004,5 HMDB00005]
}# => 1[1 HMDB00001]
在.txt文件中。我尝试使用检索()使用正则表达式,但至今未成功。正如你所猜测的,这个列表应该包含如下元素elements = ["1 HMDB00001", "2 HMDB00002", "3 HMDB00003"]
。列表是相互独立的。因此,在解析时只能考虑一行(eg. }# => 2[1 HMDB00001 ,2 HMDB00002])
。你知道吗
使用
re.findall
相反,看到了吗演示。你知道吗https://regex101.com/r/eS7gD7/19#python
假设您的模式正好是:一个数字,一个空格,
HMDB
,5个数字,按顺序排列。你知道吗结果存储在每行的dict中。你知道吗
如果
HMDB
可能不同,可以使用r'\d\s[a-zA-Z]{4}\d{5}'
。你知道吗这似乎有效,但鉴于你的问题很难确定。你也许能从你得到的答案中拼凑出一个解决方案。你知道吗
输出:
相关问题 更多 >
编程相关推荐