lxml python - 提取标签并遍历子标签

0 投票
1 回答
551 浏览
提问于 2025-04-17 10:09

我正在使用lxml来获取一个标签,代码如下:

el = doc.get_element_by_id('productDescription')

根据我的理解,el只包含那个标签及其子标签。

但是当我使用el.iterdescendants()时,却得到了主标签之外的标签!
这怎么可能呢?(这是amazon.com,所以DOM结构是好的)。

 el = doc.get_element_by_id('productDescription')
 for j in el.iterdescendants():
     print j.tag

提取一个标签并只处理它的子标签的正确方法是什么?

1 个回答

0

你应该使用 CSS 选择器

import CSSSelector

因为这样更可靠!!!

撰写回答