这是HTML:
<div><div id="NhsjLK">
<li class="EditableListItem NavListItem FollowersNavItem NavItem not_removable">
<a href="/profile/Dileep-Sankhla/followers">Followers <span class="list_count">92</span></a></li></div></div>
我想提取文本92
,并将其转换为整数并用python2打印。我怎么能?
代码:
我不想直接通过类获取它,因为我认为“list_count”太宽泛了,可能会用于页面上的其他事情。在
单从这个HTML片段来看,肯定有几种不同的选择,但就我个人而言,最好的选择之一是使用“Followers”文本/标签并获得它的下一个兄弟:
或者,另一种非常简洁可靠的方法是对父元素
^{pr2}$a
的href
值使用部分匹配(下面的*=
部分):或者,您可以检查父元素
li
的类值:相关问题 更多 >
编程相关推荐