Python靓汤img标签里面有一个div解析错误的链接显示

import urllib import urllib.request from bs4 import BeautifulSoup from urllib.request import Request, urlopen import re theurl= 'http://es.ninemanga.com/chapter/Dragon%20Ball%20Multiverse/279006.html' req = Request(theurl + '.html', headers={'User-Agent': 'Mozilla/5.0'}) thepage = urlopen(req).read() soup = BeautifulSoup(thepage, "html.parser") for divs in soup.findAll('div', {"class": "pic_box"}): temp = divs.find('img', {"id" : "manga_pic_1"}) temp1 = temp.get('src') print(temp1 + "\n")

2条回答

网友

1楼 · 编辑于 2024-04-20 02:03:50

图像具有唯一的类属性-“manga\u pic”get image with manga_pic class

网友

2楼 · 编辑于 2024-04-20 02:03:50

看起来他们可以检测到刮擦请求并阻止它们。即使使用假代理也不起作用（我试过）。试试像Selenium这样的东西，它可以自动执行浏览器活动并通过浏览器本身下载。你知道吗

编程相关推荐

禁用Eclipse Java调试器的热代码替换
每次运行jUnit测试时，JavaIntelliJIDEA都会重建整个模块
java如何从InputStream对象读取特定数据？
java我想在每次从recyclerview中单击一个项目时将对象添加到领域数据库
安卓在C和系统中退出（0）的实践。在Java中退出（0）
azure如何将文本文件附加到java中现有的zip文件？
java Spring安全性工作在tomcat服务器（Eclipse）上，但当我将war文件放入tomcat webapp时，Spring安全性就不工作了
java为什么在提供lambda参数时必须捕获异常？
java公共类扩展了JPanel
java如何在SpringAspectJ中使用“declare”指令？

相关问题更多 >

编程相关推荐

热门问题

热门文章