在scrapy中提取em标记中的文本

2024-03-29 12:53:54 发布

您现在位置:Python中文网/ 问答频道 /正文

所以我在一个破壳里,我尝试的一个选择器产生了这样的结果:

>>> response.css(".result-title a").extract()
[u'<a href="#"><em>Membership warehouse</em></a>', u'<a href="#">Publix</a>', u'<a href="#">Kroger Pharmacy</a>']

现在只获取文本,我这样做:

^{pr2}$

很明显,这省略了第一个元素,它在文本。如何我是否也将其与普通文本一起提取,以便我的最终输出是:

[u'Membership warehouse', u'Publix', u'Kroger Pharmacy']

Tags: 文本titleresponse选择器extractresultwarehousecss