from urllib.request import urlopen
from bs4 import BeautifulSoup
html = urlopen("http://www.animeplus.tv/anime-show-list/")
content =(html.read())
soup = BeautifulSoup(content)
print(soup.prettify())
该脚本可以与其他网页配合使用,但我会为我的目标网站运行该程序
<meta .$_server["request_uri"]."'"="" content="0;URL='" http-equiv="refresh"/>
我并不真正理解html代码
我认为这是某种重定向或防止网络抓取的方法
python有没有办法在重定向后访问代码,或者浏览器会以某种方式返回源代码
谢谢大家!
这里的技巧是页面重定向到自身并设置
Cookie
头,这很重要,没有它,您将无法获得在浏览器中看到的HTML下面是使用^{} 的解决方案-在同一个
session
中打开同一页:或者,您可以使用^{} ,但目前它不支持python 3。下面是它的工作原理:
相关问题 更多 >
编程相关推荐