Regex提取特定tex前后的所有内容

2024-06-16 12:16:25 发布

您现在位置:Python中文网/ 问答频道 /正文

我需要从中摘录:

<meta content=",\n\n\nÓscar Mauricio  Lizcano Arango,\n\n\n\n\n\n\n\nBerner León Zambrano Eraso,\n\n\n\n\n" name="keywords"><meta content="Congreso Visible - Toda la información sobre el Congreso Colombiano en un solo lugar" property="og:title"/><meta content="/static/img/logo-fb.jpg" 

上面显示的名字是:Óscar Mauricio Lizcano Arango和Berner León Zambrano Eraso。在

所以以后的一切都是一样的

^{pr2}$

以前呢

name="keywords". 

另外,使用python,我希望将每个名称作为列表的一个元素。对于不同的字符串,我会重复多次,并且名称的数量也会有所不同(在本例中,可能是4个名称,而不是2个名称)。在

我怎么能这么做?在


Tags: namele名称contentmetaarangokeywordsvisible
2条回答

我能做到这一点

re.findall(r'(?<=content=",)[^.]+(?=name=)', names)

这可能有助于您:

# -*- coding: utf-8 -*-
import re
or_str = '<meta content=",\n\n\nÓscar Mauricio  Lizcano Arango,\n\n\n\n\n\n\n\nBerner León Zambrano Eraso,\n\n\n\n\n" name="keywords"><meta content="Congreso Visible - Toda la información sobre el Congreso Colombiano en un solo lugar" property="og:title"/><meta content="/static/img/logo-fb.jpg"'
new_str = or_str.replace("\n","")
li = re.findall('meta content=",(.*)" name="keywords"', new_str);
new_str = ''.join(li)
print re.findall('(.*?),',new_str)

我使用replace()方法将所有换行符\n更改为NULL
然后,我使用findall查找名称并将其放入一个列表中,然后再次使用findall将每个名称存储为列表的一个元素,因为findall返回一个列表。在

相关问题 更多 >