无法使用python路径从选项卡中提取数据

test_page= requests.get('https://www.kickstarter.com/projects/1311034023/priva-the-invincible-and-reusable-camera-privacy-s/description') test_pagetree= html.fromstring(test_page.content) testxpath= test_pagetree.xpath('//*[@id="content-wrap"]/section/div[2]/div[2]/div[1]/div/div[1]/div/a[1]/text()') print testxpath

1条回答

网友

1楼 · 发布于 2024-06-07 14:17:22

尝试：

testxpath = test_pagetree.xpath('//span[contains(@class, "ksr-icon__location")]/following-sibling::text()[1]')

换句话说，找到具有class属性且其值包含"ksr-icon__location"的span元素，并提取以下文本节点。你知道吗

这将返回两个文本节点，每个节点包含Brooklyn, NY。选择第一个：

print testxpath[0].text

您不能只告诉浏览器“给我这个元素的XPath”并假设XPath表达式总是有效的。例如，浏览器中显示的HTML结构可以根据从服务器获取的HTML（以及由web刮取程序获取的HTML）进行修改。你知道吗

XPath通常可以克服这些可能的差异，如果您知道如何使用它的话。但它是一个强大而复杂的工具，一种完整的查询语言。如果您要进行web抓取，那么有必要学习XPath的工作原理（或者其他工具，并使用它）。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章