使用webcrawl提取电子邮件从站点提取url链接

email_extractor的Python项目详细描述


使用命令行界面按URL爬网的Web电子邮件提取器。一个免费的实用程序,通过将给定的URL爬网到用户提供的给定深度或要爬网的URL数来提取电子邮件地址。电子邮件地址可以从任何url中提取。电子邮件提取器可用于从给定的URL中提取电子邮件。首先,它根据用户提供的深度提取所有url的数量,然后使用简单的python库提取电子邮件。这个简单的应用程序允许在一个网站上爬行,最大爬行深度为5000个url,并提取电子邮件地址并保存到一个文件中。

用法

用法:

email_extractor [-h] [-l LIMIT] [-u URL]

Web电子邮件提取程序

可选参数:

-h, --help            show this help message and exit
-l LIMIT, --limit LIMIT
                      -l numUrlsToCrawl
-u URL, --url URL     -u http://sitename.com

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
在OSGI中使用cxf生成的客户端时出现Java类装入器问题和JaxB异常   java为什么要在javamail中迭代多部分电子邮件中的部分?   并发编程问题   JFileChooser&&System中未调用java windowClosing。退出功能不正常?   SQL查询的java语法分析   java如何使用AspectJ声明字段上的警告   什么是java向量。元素()C#等价物   java解析Android应用程序中tornado web服务中的CSV文件   java我试过c2dm,我需要服务器端   java调整JPanel大小以适应新的JLabel图标   Java与Python脚本的通信   java使用Saxon通过XSLT生成URL   java net::ERR_complete_CHUNKED_编码200(OK)来自struts应用程序中的tomcat   java如何为我的窗格设置不同的位置?   java使用Cypher Neo4j获取给定类型的所有节点(从SQL世界中的tablename中选择*)   nio使用Java解析文件值   java使用WSDL生成REST客户端会是错误的方向吗?   java如何在我的应用程序中构建类映射?   java按钮。setEnabled在第一个循环中不起作用   xPath适用于最后一页,但不适用于第一页