我尝试在Flipkart中使用lxml方法xpath为每个产品的产品描述创建一个嵌套列表
product_descriptions = []
for des in tree.xpath('//ul[@class="_1xgFaf"]'):
description=[]
for i in des.xpath('//li[@class="rgWa7D"]/text()'):
description.append(i)
product_descriptions.append(description)
for i in product_descriptions:
print(i)
但它会导致获取页面中的所有li[@class=“rgWa7D”],而不是获取所有<;李>;一个要素<;ul>;元素
以
/
开头的XPath意味着上下文是根文档,这就是为什么第二个XPath返回页面中类为“rgWa7D”的所有li
元素的原因。如果希望上下文是当前的ul
元素(由变量des
引用),请将.
添加到XPath的开头:相关问题 更多 >
编程相关推荐