Scrapy不获取Xpath上的数据

2024-05-16 05:12:58 发布

您现在位置:Python中文网/ 问答频道 /正文

我是新的刮我试图得到在下面的网址评论员的名字。你知道吗

Url 1:http://www.tripadvisor.in/Restaurant_Review-g34515-d3785272-Reviews-Kings_Orlando-Orlando_Florida.html

网址2:http://www.tripadvisor.in/Restaurant_Review-g34515-d3785272-Reviews-or220-Kings_Orlando-Orlando_Florida.html

我从scrapy shell获取URL1

然后我就跑

sel.xpath('//div[@class="username mo"]/span/text()').extract()

或者

hxs.select('//div[@class="username mo"]/span/text()').extract()

我知道这是我所期待的。你知道吗

[u'1TrippyTraveler', u'Amanda G', u'Christina B', u'Jason B', u'mitch c', u'Kim H', u'lakepointeman', u'JPawlak84', u'Rik W', u'Ashton L', u'Kayla V', u'OllieEdmunds', u'rinna40', u'rinna40']

但我对URL 2运行相同的操作。你知道吗

我明白了

[u'Kayla V', u'OllieEdmunds', u'rinna40', u'rinna40']

但预期的产出是

[u'Edmar J', u'Helena T', u'Viviane00', u'GracaSabi', u'Marlise', u'Beatriz21', u'anapemost', u'Kayla V', u'OllieEdmunds', u'rinna40', u'rinna40']

提前谢谢!你知道吗


Tags: inhttpwwwrestaurantreviewreviews网址tripadvisor