我有一个网站,在html中有很多隐藏的标签。 我粘贴了下面的源代码。 问题是隐藏标签上有两种类型
1.
带有style="display:none"
的
2.
它们在每个td
标记下都有提到的样式列表。在
每一个td标签都会改变。 对于下面的示例,它有以下样式:
hLcj{display:none}
.J9pE{display:inline}
.kUC-{display:none}
.Dzkb{display:inline}
.mXJU{display:none}
.DZqk{display:inline}
.rr9s{display:none}
.nGF_{display:inline}
因此带有class=hLcj, kUC, mXJU, rr9s,etc
的元素是隐藏元素
我想提取整个tr的文本,但排除这些隐藏的标记。 我绞尽脑汁想了好几个小时,还是没有成功。在
任何帮助都将不胜感激。谢谢
我正在使用bs4
和{
使用selenium将使任务变得更容易,因为它知道哪些元素是隐藏的,哪些元素是不隐藏的
但是,无论如何,这里有一个基本代码,您可能需要进一步改进。这里的想法是解析
style
标记并获得要排除的类的列表,有一个要排除的标记列表,并检查tr
中每个子元素的style
属性:印刷品:
^{pr2}$另请参见:
相关问题 更多 >
编程相关推荐