如何使用BeautifulSoup从具有特定开头的标签中获取仅字符串?

2024-04-26 23:15:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在抓取用户名,所有用户名都在同一个标签中,它们的HREF都以相同的开头,如下所示:

<a href="http://lolprofile.net/summoner/eune/Sadastyczny" class="link5">Sadastyczny</a>

我试着只在他们有类link5的情况下查找,但是还有其他值有我不想刮取的类。那么,有没有一种方法可以搜索所有具有

href="http://lolprofile.net/summoner"

在他们,但不是其余的,因为这显然是不同的每个用户名


Tags: 方法httpnet情况标签用户名classhref
1条回答
网友
1楼 · 发布于 2024-04-26 23:15:20

BeautifulSoup documentation开始

使用正则表达式可以匹配站点。如果您从未听说过正则表达式,可以使用以下方法:

soup.find_all(href=re.compile("http://lolprofile.net/summoner/*"))

别忘了导入re-模块

相关问题 更多 >