使用漂亮的汤提取css链接

from bs4 import BeautifulSoup import urllib.request url="http://www.something.com" page = urllib.request.urlopen(url) soup = BeautifulSoup(page.read()) for link in soup.find_all('link'): #Lists out css links print(link.get('href'))

2条回答

网友

1楼 · 编辑于 2024-04-25 19:51:51

您可以将extra parameters传递给find_all，以进一步过滤查询。在

尝试：

soup.find_all('link', rel="stylesheet")
soup.find_all('script', src=re.compile(".*"))

网友

2楼 · 编辑于 2024-04-25 19:51:51

找到所有的“link”元素并过滤掉那些有这个元素的元素rel="stylesheet"。您可以使用以下方法：

>>> [link["href"] for link in soup.findAll("link") if "stylesheet" in link.get("rel", [])]

我为当前的stackoverflow页面运行了上面的代码。结果：

^{pr2}$

编程相关推荐

为什么按钮点击播放声音的方法不起作用
java如何在创建小于窗口的PGraphics对象时避免“抗锯齿效应”，然后将其放大到窗口大小？
作用域中的java Antlr check返回语句
java是否在swing中显示所有鼠标悬停事件？
编辑：JAVA（Swing）：JAVA（Swing）中是否有任何功能可以像javafx中的webview一样保存Html页面
java GPS文本输入
如何使用Java SE生成多个jasper报告
swing Java ActionListener未拾取按钮
性能为什么java内置序列化比Gson差？
java JAXR使用相同路径创建多个类

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用漂亮的汤提取css链接

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >