帕图是一只小蜘蛛

patu的Python项目详细描述


帕图

一个小蜘蛛,用于检查站点的404和500s。patu需要httplib2和lxml:

pip install -U httplib2 lxml

快速使用

查看可用选项:

patu.py –help

使用5个工作人员创建整个站点的蜘蛛网,只显示错误:

patu.py –spiders=5 www.example.com

对于spider,在第一级链接之后停止:

patu.py –depth=1 www.example.com

要获取网站上每个链接页面的列表:

patu.py –generate www.example.com > urls.txt

使用一个文件代替对url的搜索,并显示所有响应:

patu.py –input=urls.txt –verbose www.example.com

URL文件格式

<;code>;–generate生成的输出格式如下:

FIRST_URL<TAB>None LINK1<TAB>REFERER LINK2<TAB>REFERER

<;code>;–input<;/code>;可以采用该格式的文件,或者每行一个url,而不使用referer。<;code>;–input=-<;/code>;从stdin读取。

测试

帕图用鼻子做测试。安装机头并进行测试:

pip install -U nose nosetests

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
junit cucumber为什么会找到“runTest.java”来运行测试?   在Eclipse中找不到java KeyPairGenerator   java NotSerializableException即使在实现Serializable之后   noclassdeffounderror(java字符串连接)为什么会出现这种异常?   java Guice:将接口绑定到由动态代理创建的实例   使用Spring数据neo4j创建空间索引时发生java错误   java对于需要在50多个excel文件上运行并且每个文件平均包含25k行的项目,最佳的方法是什么   javaNIO中的java缓冲区写入/发送消息问题   如何在Java/eclipse中添加不调用super()的警告   JavaSpring:mvcUrl映射错误的id   java应该在getInstance或构造函数中使用Init方法吗?   安卓中的java空指针异常错误   java Jsoup不能完全获取原始html代码