Python服务器检测中的网站抓取

import urllib2 LINK = "http://www.sample.com/article/1" HEADERS = {'User-Agent': 'Mozilla5.0/...'} # Ellipsis for brevity req = urllib2.Request(link, data=None, headers=HEADERS) resp = urllib2.urlopen(req, timeout=20).read()

1条回答

网友

1楼 · 发布于 2024-05-14 15:52:43

您不知道服务器端发生了什么。

你可以继续做实验，猜猜它在另一边是如何工作的。如果这是一个用户代理的问题-只要继续发送它（也许每隔一段时间更改一次）为您的所有请求，包括第一个。在

另外，我会在一个新的会话中打开chrome dev工具（匿名），并记录您正在执行的所有操作，这样您就可以看到真正的浏览器发出的请求的结构。在

编程相关推荐

ArrayList中实体对象上的JAVA泛型
带Redis的爪哇芹菜vs单用Redis
java在设备面向横向时隐藏标题栏/通知栏
java JXTreeTable：如何使用ComponentProvider为一列设置渲染器
java创建异常的成本与记录异常的成本相比
java在方法参数中使用setter传递新对象
java在一个类中的方法与另一个类中的方法交互时遇到问题
java如何迭代2个大小相等的ArrayList
Java getDesktop（）。open在Windows中工作，但在Mac中不工作
从tomcat切换到jetty后的java“无法启动嵌入式容器”，Spring引导

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python服务器检测中的网站抓取

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >