嗨,我正在尝试从页面的选项卡中提取数据
我正试图找出位置
纽约布鲁克林
我正在使用下面的python代码和path(使用googlechrome-inspect)。你知道吗
test_page= requests.get('https://www.kickstarter.com/projects/1311034023/priva-the-invincible-and-reusable-camera-privacy-s/description')
test_pagetree= html.fromstring(test_page.content)
testxpath= test_pagetree.xpath('//*[@id="content-wrap"]/section/div[2]/div[2]/div[1]/div/div[1]/div/a[1]/text()')
print testxpath
尝试:
换句话说,找到具有
class
属性且其值包含"ksr-icon__location"
的span
元素,并提取以下文本节点。你知道吗这将返回两个文本节点,每个节点包含
Brooklyn, NY
。选择第一个:您不能只告诉浏览器“给我这个元素的XPath”并假设XPath表达式总是有效的。例如,浏览器中显示的HTML结构可以根据从服务器获取的HTML(以及由web刮取程序获取的HTML)进行修改。你知道吗
XPath通常可以克服这些可能的差异,如果您知道如何使用它的话。但它是一个强大而复杂的工具,一种完整的查询语言。如果您要进行web抓取,那么有必要学习XPath的工作原理(或者其他工具,并使用它)。你知道吗
相关问题 更多 >
编程相关推荐