我正在抓取用户名,所有用户名都在同一个标签中,它们的HREF都以相同的开头,如下所示:
<a href="http://lolprofile.net/summoner/eune/Sadastyczny" class="link5">Sadastyczny</a>
我试着只在他们有类link5的情况下查找,但是还有其他值有我不想刮取的类。那么,有没有一种方法可以搜索所有具有
href="http://lolprofile.net/summoner"
在他们,但不是其余的,因为这显然是不同的每个用户名
Tags:
从BeautifulSoup documentation开始
使用正则表达式可以匹配站点。如果您从未听说过正则表达式,可以使用以下方法:
soup.find_all(href=re.compile("http://lolprofile.net/summoner/*"))
别忘了导入
re
-模块相关问题 更多 >
编程相关推荐