对每个请求使用假用户代理提供的随机用户代理

scrapy-fake-useragent的Python项目详细描述


PyPI versionRequirements Status

垃圾假冒用户代理

基于 fake-useragent。它 基于usage statistics提取User-Agent字符串 来自real world database

安装

最简单的方法是通过pip安装

pip install scrapy-fake-useragent

配置

关闭内置的UserAgentMiddleware并添加 RandomUserAgentMiddleware

在scrapy中>;=1.0:

DOWNLOADER_MIDDLEWARES={'scrapy.downloadermiddlewares.useragent.UserAgentMiddleware':None,'scrapy_fake_useragent.middleware.RandomUserAgentMiddleware':400,}

在scrapy<;1.0中:

DOWNLOADER_MIDDLEWARES={'scrapy.contrib.downloadermiddleware.useragent.UserAgentMiddleware':None,'scrapy_fake_useragent.middleware.RandomUserAgentMiddleware':400,}

配置用户代理类型

有一个配置参数RANDOM_UA_TYPE默认为random,它被逐字传递给伪用户代理。因此,可以将其设置为firefox,以仅模拟firefox浏览器。不过,最有用的方法是使用desktopmobile值分别发送桌面或移动字符串。

使用 FLASY代理< EH3>

要与随机代理(如scrapy-proxies)的中间件一起使用,您需要:

  1. RANDOM_UA_PER_PROXY设置为true以允许每个代理进行切换
  2. RandomUserAgentMiddleware的优先级设置为大于scrapy-proxies,以便在句柄ua之前设置代理

配置假用户代理回退

有一个配置参数FAKEUSERAGENT_FALLBACK默认为 None。可以将其设置为字符串值,例如MozillaYour favorite browser,此配置可以完全禁用任何 讨厌的例外。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
NetBeans中的Java Swing滚动窗格   java如何与具有复合键的表建立关系?   Android中读取文件时java数据丢失   java黄瓜场景。embed在ubuntu机器上不工作?   java从spring mvc控制器操作中,我如何获得请求/响应的访问权限?   java减去两个长值   java选择下一个值firebase 安卓   用于起始和结尾连字符的java正则表达式   Java正则表达式解释   java Lifefay freemarker ADT:方法不可用?   java我怎样才能让我的开关盒作用于JFrame?   java在我的场景中使用连接池的理想方式是什么   java我如何接受jsoup的cookies?   java如何将整数数组更改为字符串数组?   java Android操作\u指针\u向上直到剩余触摸移动时才调用   java为什么gradle会出错?   io如何在java中复制/拆分输入流?   java使JButton不可见,但尊重其原始空间   java Spring提交表单获取复选框值不起作用