Python/BeautifulSoup从两个标题之间提取列表<UL><LI>

<h2> First Heading </h2> <h2> <span class="class" id="id1">Second Heading</span> </h2> <ul> <li>One</li><li>Two</li><li>Three</li><li>Four</li><li>Five</li> </ul> <h2> <span class="class" id="id2">Third Heading</span> </h2> <ul> <li>Red</li><li>Orange</li><li>Yellow</li><li>Green</li><li>Blue</li> </ul> <h2> <span class="class" id="id3">Last Heading</span> </h2> <ul> <li>VVV</li><li>WWW</li><li>XXX</li><li>YYY</li><li>ZZZ</li> </ul>

1条回答

网友

1楼 · 发布于 2024-06-11 01:46:06

使用^{}CSS选择器搜索第二个<h2>标记
使用^{}方法搜索下一个<ul>标记

soup = BeautifulSoup(html, "html.parser")

print(
    soup.select_one("h2:nth-of-type(2)")
    .find_next("ul")
    .get_text(strip=True, separator="|")
    .split("|")
)

输出：

['One', 'Two', 'Three', 'Four', 'Five']

编辑以选择“事件”下的所有<li>标记：

for tag in soup.select(".mw-parser-output > ul:nth-of-type(1) li"):
    print(tag.text)

编程相关推荐

在Java中，从URL检索JPEG并将其转换为适合嵌入RTF文档的二进制或十六进制格式
java我需要log4j 1.2和2.5在同一个webapp中共存
java OSX应用程序图标和名称在运行时更改
java如何防止在暂时不满足条件时终止线程？
java如何为已开发的web应用程序使用dropwizard
classloader如何避免java库的类加载冲突
java下载文件太慢了
apache CommonConfigurations2中的java格式XML输出/修改转换器
linux在Java中发出线程信号
java DataBuffer到DataBufferByte转换抛出错误

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python/BeautifulSoup从两个标题之间提取列表<UL><LI>

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >