lxml python - 提取标签并遍历子标签
我正在使用lxml来获取一个标签,代码如下:
el = doc.get_element_by_id('productDescription')
根据我的理解,el
只包含那个标签及其子标签。
但是当我使用el.iterdescendants()
时,却得到了主标签之外的标签!
这怎么可能呢?(这是amazon.com,所以DOM结构是好的)。
el = doc.get_element_by_id('productDescription')
for j in el.iterdescendants():
print j.tag
提取一个标签并只处理它的子标签的正确方法是什么?
1 个回答
0
你应该使用 CSS 选择器
import CSSSelector
因为这样更可靠!!!