从Web获取免费代理

async-freeprox的Python项目详细描述


免费代理获取

获取网上的有效免费代理。

使用方法

首先先确保安装了依赖包:

  # 终端运行
  pip install -r requirements.txt

一次性获取有效的代理

非常简单, 直接使用proxy.py文件中的run_getter_and_tester函数, 即可 返回一个有效的代理池集合(set)。

TEST_URL='https://wwww.baidu.com'data=run_getter_and_tester(TEST_URL)print(data)

返回结果:

finaly we got 17  validated proxies!
{'183.157.4.173:8118', '222.128.9.235:33428', 
 ...}

建议把TEST_URL改成你的目标爬虫网站

维持一个代理池

考虑到免费代理的有效生命周期较短, 所以需要不断地获取免费代理->加入代理池(这里使用的是redis)->验证池中代理的有效性。 在设置完settings中的:

  • TEST_URL (一般是爬虫的对象网站)
  • INTERVAL (获取代理的间隔)
  • FREEPROXY_REDIS_NAME (redis代理池名称) 运行方法:
# 终端运行pythonmain.py

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
如何下载多个。java中的PDF文件   linux Java打开文件,形成实际用户主页~/   java如何在时间线内维护TableView选择?   java Hibernate注释@Where vs@WhereJoinTable   Java读/写访问异常FileNotFoundException(访问被拒绝)   继承在Java中是否可以扩展最后一个类?   Android HttpClient使用java使应用程序崩溃。lang.OutOfMemoryError:pthread_create   java为什么即使我在proguardproject中添加了jar文件,也会出现这种错误。txt?   如果添加JButton,swing Java FocusListener和KeyListener将无法工作   java使用solrj检索json格式的SolrDocument   使用Microsoft Visual Studio代码进行Java编程   java NoClassDefFoundError:org/apache/log4j/Logger   哈希集中包含相等对象的java   java中的参数化构造函数是否需要有一个主体?   java类似于NetBeans不必要的代码检测器   Java实践问题   java Blackberry“[projectname].调试文件丢失”和“I/O错误:找不到程序”jar