2024-05-14 23:00:16 发布
网友
我想通过漂亮的汤获得html页面中每个标签的所有属性 在一个数组中
例如,我有一个html页面 我想要一个字符串数组中的所有标记属性
<div att0="content1"> <a href="link1">link data</a> </div>
结果是: [内容1,链接1]
查找所有元素并从^{} attribute获取属性:
attrs = [] for elm in soup(): # soup() is equivalent to soup.find_all() attrs += list(elm.attrs.values()) print(attrs)
演示:
import bs4 html = ''' <div att0="content1"> <a href="link1">link data</a> </div> <div att0="content1"> <a href="link1">link data</a> </div> <div att0="content1"> <a href="link1">link data</a> </div>''' soup = bs4.BeautifulSoup(html, 'lxml') for div in soup.find_all('div', att0=True): out = [div['att0'], div.a['href']] print(out)
输出:
查找所有元素并从^{} attribute 获取属性:
演示:
^{pr2}$输出:
^{pr2}$相关问题 更多 >
编程相关推荐