我使用下面的脚本来获取信息来创建邮政邮件标签。在
该脚本从my countries公共税务数据库的ul
类“description keywords”标记中获取所有数据。在
我的问题是如何只刮取ul
类“description key”的前3个li
元素。请记住,这个类在html中被使用了100多次,我只需要包含邮件地址信息的前3个元素。在
我需要添加什么来只获得我需要的li
元素?在
这个脚本运行得很好,但是它获取的信息太多了。在
谢谢
下面的代码行获取了我需要的所有数据,但也提供了2个我不需要的额外的li
元素。在
a = soup.findAll(attrs={"class" : "description keywords"})
我只需要收集ul
类的前3个li
元素-“description keywords”
您可以将限制设置为
find_all
。{1>仍然会使你的代码返回更快。为了获得更快的处理速度,可以调用find_next
三次。在http://www.crummy.com/software/BeautifulSoup/bs4/doc/#searching-the-tree
相关问题 更多 >
编程相关推荐