Findall<li>与Beautiulsoup

2024-05-14 08:34:26 发布

您现在位置:Python中文网/ 问答频道 /正文

我想用beauthulsoup导出项目数据的“def”部分:

<div
   <ul
      <li class : "abc" project-data: "def">
      <li class : "abc" project-data: "ghi">

我试过:

^{pr2}$

有人知道如何检索这些数据吗?在


Tags: 数据项目divprojectdatadefliul
2条回答

您可以使用CSS选择器li[project-data]。这将找到包含属性project-data=的所有<li>标记。CSS选择器在bs4中使用方法select()select_one()调用:

from bs4 import BeautifulSoup

data = '''<div>
   <ul>
      <li class="abc" project-data="def">
      <li class="abc" project-data="ghi">'''

soup = BeautifulSoup(data, 'lxml')

for li in soup.select('li[project-data]'):
    print(li['project-data'])

印刷品:

^{pr2}$

有关CSS selectors here的详细信息。在

假设您的HTML或多或少是这样的:

<div>
 <ul>
     <li class = "abc" project-data= "def"></li>
     <li class = "abc" project-data= "ghi"></li>
   </ul>
</div>

执行:

^{pr2}$

输出:

def
ghi

相关问题 更多 >

    热门问题