所以我在一个破壳里,我尝试的一个选择器产生了这样的结果:
>>> response.css(".result-title a").extract()
[u'<a href="#"><em>Membership warehouse</em></a>', u'<a href="#">Publix</a>', u'<a href="#">Kroger Pharmacy</a>']
现在只获取文本,我这样做:
^{pr2}$很明显,这省略了第一个元素,它在文本。如何我是否也将其与普通文本一起提取,以便我的最终输出是:
[u'Membership warehouse', u'Publix', u'Kroger Pharmacy']
我会找到
a
内任何级别的所有文本节点并“连接”它们:演示:
^{pr2}$相关问题 更多 >
编程相关推荐