使用url的便利功能
cs.urlutils的Python项目详细描述
- netrchttpasswordmgr:httppasswordmgrWithDefaultRealm的一个子类,如果未存储任何重写凭据,则该子类将查询.netrc文件。
- url:工厂接受返回str子类实例的url字符串,该实例具有访问url属性的方法和属性
–.node:获取并分析内容,返回名为“node”的唯一节点;示例:.title
–.nodes:获取并解析内容,返回所有名为“node”的节点;示例:.ps
–.basename:url路径的basename
–.base url:此文档的基本url
–.content:文档的内容
–.content_type:url内容类型
–.dirname:url路径的dirname
–.domain:去掉第一个组件的主机名部分
–.feedparsed:通过feedparser模块解析内容
–.find_all():对解析的内容调用beautifulsoup的find_all
–.flush:忘记所有缓存的内容
–.fragment:urlparse.urlparse返回的url片段
–.hostname:主机名部分
–.hrefs(self,absolute=false):返回引用为ref=attributes的所有URL
–.netloc:urlparse.urlparse返回的URL netloc
–.page_title:页面标题,可能是空字符串
–.params:urlparse.urlparse返回的URL参数
–.parent:parent url,.dirname已解析
–.parsed:由beautifulsoup解析为html的url内容
–.parts:URL被urlparse.urlparse解析为部分
–.password:urlparse.urlparse返回的url密码
–.path:urlparse.urlparse返回的url路径
–.path_元素:非空路径组件
–.port:urlparse.urlparse返回的url端口
–.query:urlparse.urlparse返回的URL查询
–.scheme:urlparse.urlparse返回的url方案
–.srcs:返回所有引用为src=属性的url
–.username:urlparse.urlparse返回的url用户名
–.xml:内容已解析并返回为elementtree.xml
–.xml_find_all(self,match):调用elementtree.xml的.findall()方法的便利方法