如何使用BeautifulSoup查找指向特定域名的所有链接?
我该如何使用BeautifulSoup来找到页面中指向特定域名的所有链接呢?
1 个回答
8
使用 SoupStrainer,
from BeautifulSoup import BeautifulSoup, SoupStrainer
import re
# Find all links
links = SoupStrainer('a')
[tag for tag in BeautifulSoup(doc, parseOnlyThese=links)]
linkstodomain = SoupStrainer('a', href=re.compile('example.com/'))
编辑:修改了官方文档中的示例。