2024-06-11 07:43:56 发布
网友
我想根据您的投票从主注释中提取@title部分:https://www.fragrantica.com/perfume/Remy-Latour/Cigar-9351.html
@title
我获取了HTML,然后在scrapy shell上尝试了这行代码,但输出是None:
scrapy shell
None
response.xpath('//*[@id="userMainNotes"]/div/img/@title).extract_first()
我做错什么了?你知道吗
这会有用的
response.xpath('//span[contains(@id, "note")]/img[@rel]/@title')
不要忘记将用户代理设置为设置.py你知道吗
Crawler data form website use Scrapy 1.5.0 - Python
如果您检查源代码(Ctrl+U),您会发现:
Ctrl+U
<div title="96:241;171:117;33:103;34:103;41:70;128:63;4:59;182:59;170:58;75:56;191:48;21:39;77:39;14:28" id="userMainNotes">Loading...</div>
这意味着上面的<div>是由Javascript呈现的,这就是代码无法工作的原因。你知道吗
<div>
这会有用的
不要忘记将用户代理设置为设置.py你知道吗
Crawler data form website use Scrapy 1.5.0 - Python
如果您检查源代码(
Ctrl+U
),您会发现:这意味着上面的
<div>
是由Javascript呈现的,这就是代码无法工作的原因。你知道吗相关问题 更多 >
编程相关推荐