使用webcrawl提取电子邮件从站点提取url链接

email_extractor的Python项目详细描述


使用命令行界面按URL爬网的Web电子邮件提取器。一个免费的实用程序,通过将给定的URL爬网到用户提供的给定深度或要爬网的URL数来提取电子邮件地址。电子邮件地址可以从任何url中提取。电子邮件提取器可用于从给定的URL中提取电子邮件。首先,它根据用户提供的深度提取所有url的数量,然后使用简单的python库提取电子邮件。这个简单的应用程序允许在一个网站上爬行,最大爬行深度为5000个url,并提取电子邮件地址并保存到一个文件中。

用法

用法:

email_extractor [-h] [-l LIMIT] [-u URL]

Web电子邮件提取程序

可选参数:

-h, --help            show this help message and exit
-l LIMIT, --limit LIMIT
                      -l numUrlsToCrawl
-u URL, --url URL     -u http://sitename.com

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java本机方法的源代码可用吗?   java如何使父方法抛出异常?   java Android以编程方式设置不同屏幕大小/密度的布局   java如何使用一个变量来管理所有客户端请求   java输入一个txt文件,每行有一组数字   json java从jsonobject获取jsonarray错误   java将一个(WAV)写入一个文件只会说一个单词(最后一个单词)   java Telnet忽略原始字节   proguard java。运行桌面应用程序时出现lang.VerifyError   java用左键移动JLabel?   java如何在jText区域验证选项卡?   文件服务器客户端Javasocket编程中的字符串搜索   java省略了JSTL中的最后一个逗号<c:out>   java如何找到if或else代码已执行的次数?   java JavaScript WebSocket send()方法未执行   浮点数声明上的java标识符预期错误   java这是指二进制搜索算法吗?   编译mod at:reobfJar java时的minecraft问题。util。拉链ZipException:重复条目   java检测特定的震动运动(如图所示:D)