我正在刮一页,我必须从这个格式中得到雇员人数:
<h5>Number of Employees</h5>
<p>
20
</p>
我需要得到数字“20”的问题是,这个数字并不总是在同一个标题,有时是在“h4”和有更多的“h5”标题,所以我需要找到数据,是包含在标题名为:“雇员人数”和摘录的数字,是在包含的段落
这是页面的链接
http://www.bbb.org/chicago/business-reviews/paving-contractors/lester-s-material-service-inc-in-grayslake-il-72000434/
Tags:
好吧,最简单的方法是找到一个包含“雇员数”的元素——文本,然后简单地把段落放在后面,假设段落总是紧跟在后面。你知道吗
下面是一段快速而肮脏的代码,可以实现这一点,并打印出数字:
相关问题 更多 >
编程相关推荐