使用xpath won'

2024-04-26 05:34:49 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用xpath来抓取amazon的网页,但它不起作用。谁能给我一些建议吗?以下是指向该页面的链接: a link

我想刮掉这些:“有趣的,信用卡大小的印刷品” 我使用的代码是:

from lxml import html
import requests

url = 'http://www.amazon.co.uk/dp/B009CX5VN2'
page = requests.get(url)
tree = html.fromstring(page.text)
feature_bullets = tree.xpath('//*[@id="feature-bullets"]/ul/li[1]/span/text()')

但是功能子弹总是空的。真的需要帮助。在


Tags: textimporttreeurl网页amazonhtmlpage
1条回答
网友
1楼 · 发布于 2024-04-26 05:34:49

我下载的HTML与您的期望不符。下面是一个适合我的表达方式:

tree.xpath('//div[@id="technicalProductFeaturesATF"]/ul/li[1]/text()')

完整程序:

^{pr2}$

结果:

$ python foo.py 
['Fun, credit card-sized prints',
 'LCD film counter and shooting mode display',
 'Camera mounted mirror for self portraits',
 'Powered by CR2 Batteries, Built-in, Automatic electronic flash',
 'Fujifilm Instax Mini 25 + 30 Instax Mini Film']

相关问题 更多 >

    热门问题