如何使用BeautifulSoup查找指向特定域名的所有链接?

5 投票
1 回答
2760 浏览
提问于 2025-04-15 18:34

我该如何使用BeautifulSoup来找到页面中指向特定域名的所有链接呢?

1 个回答

8

使用 SoupStrainer,

from BeautifulSoup import BeautifulSoup, SoupStrainer
import re

# Find all links
links = SoupStrainer('a')
[tag for tag in BeautifulSoup(doc, parseOnlyThese=links)]

linkstodomain = SoupStrainer('a', href=re.compile('example.com/'))

编辑:修改了官方文档中的示例。

撰写回答