Python RequestsHTML()无法加载css

2024-04-25 14:14:21 发布

您现在位置:Python中文网/ 问答频道 /正文

我想下载一个页面的css,并实现与浏览器中相同的外观。问题是刮取的结果看起来不同

例如,我想下载谷歌的登录页

这就是我使用的代码:

import requests
from requests_html import HTMLSession

session = HTMLSession()

r = session.get('https://www.google.com')

r.html.render()

file = open("start.html", "w")
file.write(r.text)
file.close()

Tags: 代码fromhttpsimportgetsessionhtmlwww
1条回答
网友
1楼 · 发布于 2024-04-25 14:14:21

css通常位于标记中

尝试分析bs4中的页面

from bs4 import BeautifulSoup as BS
from requests_html import HTMLSession

session = HTMLSession()

r = session.get('https://www.google.com')

r.html.render()

soup=BS(r.text)

css = [link.get("href") for link in soup.findAll("link") if "stylesheet" in link.get("rel")]

现在css应该是指向所用css的链接列表

相关问题 更多 >