排序友好的uri重新排序转换(surt)python包。
surt的Python项目详细描述
排序友好的uri重新排序转换(surt)python包。
用法:
>>> from surt import surt >>> surt("http://archive.org/goo/?a=2&b&a=1") 'org,archive)/goo?a=1&a=2&b' >>> surt("http://archive.org/goo/?a=2&b&a=1", trailing_comma=True) 'org,archive,)/goo?a=1&a=2&b' >>> surt("http://123.456.78.910/goo/?a=2&b&a=1", reverse_ipaddr=False) '123.456.78.910)/goo?a=1&a=2&b'
安装:
pip install surt
或者从git安装dev版本:
pip install git+https://github.com/internetarchive/surt.git#egg=surt
有关SURT的更多信息: http://crawler.archive.org/articles/user_manual/glossary.html#surt
这主要是webarchive commons org.archive.url的一个python端口 包裹。org.archive.url包的原始Java版本是 在这里: https://github.com/iipc/webarchive-commons/tree/master/src/main/java/org/archive/url
此模块依赖于tldextract模块来查询公共 后缀列表。tldextract可以通过pip
安装