在python中webscraping时在HTML中定位正确的标记

1条回答

网友

1楼 · 发布于 2024-04-23 10:56:36

据我所知-您知道BTC字符串，可以使用它来创建定位器。你知道吗

因此，如果是XPath，可以使用它和following-sibling::text()：

//h2[. = 'BTC']/following-sibling::text()

使用lxml.html的示例：

from lxml.html import fromstring

data = """<div class="rankings-col__header__segment"><h2>BTC</h2><weak>usd </weak>10857.00</div>"""

root = fromstring(data)
print(root.xpath("//h2[. = 'BTC']/following-sibling::text()"))

打印['10857.00']。你知道吗

如果您碰巧使用BeautifulSoup，那么它将是：

from bs4 import BeautifulSoup


data = """<div class="rankings-col__header__segment"><h2>BTC</h2><weak>usd </weak>10857.00</div>"""

soup = BeautifulSoup(data, "html.parser")
print(soup.find("h2", string="BTC").find_next_sibling(text=True))

编程相关推荐

如果字段相同，java共享对象的单个实例
if语句在从参数（JAVA）获取getDiscount（）时遇到问题
使用JanusGraph Java API和HBase时出现临时BackendException
java读取嵌套的yaml值而不传入根对象
java为什么我不能用这段代码从链表中删除第一个节点？
javascript为什么验证错误在旧的情况下会持续？
java如何在JSch SFTP上重新发布？
使用java将json转换为xml
java如何将EditText的值放入对话框
java Hibernate：与EmbeddedID重复的getter/setter？

相关问题更多 >

编程相关推荐

热门问题

热门文章

在python中webscraping时在HTML中定位正确的标记

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >