允许从以前的几个url获取html。有时这是需要得到的网页,需要cookies或一个http引用,以获得特定的网页。

html_jumping的Python项目详细描述


欢迎使用HTML跳转

Author:
  • Daniel Perez Rada <@dperezrada>

什么?

允许从以前的几个url获取html。有时这是需要得到的网页,需要cookies或一个http引用,以获得特定的网页。

先决条件

您需要:

要运行测试,您还需要:

  • lxml

示例

无代理

from html_jumping import HtmlJumping
handler = HtmlJumping()
urls = [
    {
        'url': 'http://pypi.python.org/pypi',
        'method': 'GET'
    },
    {
        'url': 'http://pypi.python.org/pypi',
        'method': 'GET',
        'body': {
            'term': 'html_jumping',
            ':action': 'search',
            'submit': 'search'
        }
    }
]
received_header, received_content = handler.get(urls)

代理

允许您使用http代理,您将需要安装socksipy库。

from html_jumping import HtmlJumping
handler = HtmlJumping()
urls = [
    {
        'url': 'http://pypi.python.org/pypi',
        'method': 'GET'
    },
    {
        'url': 'http://pypi.python.org/pypi',
        'method': 'GET',
        'body': {
            'term': 'html_jumping',
            ':action': 'search',
            'submit': 'search'
        }
    }
]
received_header, received_content = handler.get(
    urls,
    proxy_info = {'host': '127.0.0.1', 'port': '8081'}
)

具有永久标题

这将在每次调用中发送标题“accept language”。

from html_jumping import HtmlJumping
handler = HtmlJumping()
urls = [
    {
        'url': 'http://pypi.python.org/pypi',
        'method': 'GET'
    },
    {
        'url': 'http://pypi.python.org/pypi',
        'method': 'GET',
        'body': {
            'term': 'html_jumping',
            ':action': 'search',
            'submit': 'search'
        }
    }
]
received_header, received_content = handler.get(
    urls,
    permanent_headers = {'Accept-Language': 'es, en-cl;q=0.5'}
)

测试

运行

>> nosetests

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
当注释bean用作另一个bean中的集合时,java自定义约束验证器不工作   毕加索中的java错误get()无法应用于(安卓.content.Context)   java RSA Encryption生成带有“\n”字符的字符串,我无法解密   java使用无线路由器访问Wamp   java EhCache磁盘持久性可以持久化任意对象   将文件复制到数组(Java)   Java JScience:如何打印整个实数?   用户界面在JAVA中鼠标点击“设置”按钮时如何获取文本字段内容   JAVA中ArrayList<ArrayList>的深度副本   eclipse的java代码感知样式自动完成   netbeans 7无法从另一个平台运行java项目   hbm中的java异常。xml   java在电子邮件正文中发送HTML   按名称列出的tomcat Java jconsole应用程序   在活动之间传递ArrayList的java机制   Java中long的模运算符是什么?