从给定的URL中提取电子邮件地址。

extract-emails的Python项目详细描述


从给定网站提取电子邮件

要求

  • 最小Python3.6
  • 请求
  • lxml

安装

pip install extract_emails

用法

from extract_emails import ExtractEmails

em = ExtractEmails(url, depth=None, print_log=False, ssl_verify=True, user_agent=None, request_delay=0.0)
emails = em.emails
  • url:str,例如:http://example.com
  • depth:int,扫描深度
  • print_log:布尔值,是否打印日志
  • ssl_verify:布尔型
  • 用户代理:str
  • 请求延迟:浮点

ssl\u verify-用于避免此类错误:*超过url: /API/v1/吊舱?watch=false(由sslerror引起(sslerror(1,“[ssl: 证书验证失败]证书验证失败 (_ssl.c:777)’)*

用户代理-您可以从几个用户代理中选择:iemsieoperachromegooglefirefoxsafarirandom

请求延迟-请求之间的时间延迟(秒)

return电子邮件列表。

更改日志

版本3.0.4

    Buf修复< /LI>

版本3.0.3

  • 改进解析器

版本3.0.1

  • 最低python版本:3.6
  • 删除假用户代理库
  • 改进电子邮件提取功能
  • 添加请求之间的时间延迟

版本2.0.0

  • 将beautifulsoup替换为lxml
  • 改进的电子邮件正则表达式
  • 添加了不同的用户代理

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何在Log4J 2配置的查找中使用多个替换?可能吗?   java Hazelcast:是否需要查询缓存上的索引?   获取java中泛型的名称(T in<T extenses…>)   Struts 2中不丢失请求属性的java重定向   java如何在活动中使用结果对象?   基于java的web服务免费短信库   Java我不明白为什么在更改switch语句的顺序时会得到不同的输出   java为什么这段代码说变量j可能没有被初始化??它正在循环内部初始化   关于enum的java问题   java是否存在与Spring的@Value注释相当的JSR330?   Java EE Websockets   年轻的垃圾收集在java 7和java 6中暂停的时间更长   日志记录将日志记录程序消息写入文件和文本区域,同时在Java中保持默认行为   png中的java背景图像未以stackpanel质量呈现