最后一个站点地图分析器

ultimate-sitemap-parser的Python项目详细描述


Build StatusDocumentation StatusCoverage StatusPyPI package

用于Python3.5+的网站站点地图分析器。

功能

安装

pip install ultimate_sitemap_parser

用法

fromusp.treeimportsitemap_tree_for_homepagetree=sitemap_tree_for_homepage('https://www.nytimes.com/')print(tree)

sitemap_tree_for_homepage()将返回表示站点地图的AbstractSitemap子类对象的树 在网站上找到层次结构;请参见reference of AbstractSitemap subclasses

如果您只想列出网站内所有站点地图中找到的所有页面,请考虑使用all_pages()方法:

# all_pages() returns an Iteratorforpageintree.all_pages():print(page)

all_pages()方法将返回生成SitemapPage对象的迭代器;请参见reference of SitemapPage

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
apache commons 3.1中的java httpClient代理支持   ubuntu 14.04 Java:找不到类Xmx1g   java如何用当前用户的数据填充recyclerview?   java Alter Hibernate事务超时仅用于一种方法?   如果没有pow()、函数或递归,如何在c/c++中使用幂函数   java将html UI与本机安卓应用程序相结合   创建GridPane子项时发生java错误   java在基类构造函数中调用虚方法   客户端重新连接javasocket   具有建议日期的java Open DatePicker   雅加达ee Java ee请求范围和异步   classnotfoundexception无法执行目标组织。科德豪斯。项目<projectname>上的mojo:execmavenplugin:1.6.0:java(defaultcli):   java字符串内容相同,但equals方法返回false   primefaces调度的java问题   java帮助我理解关于实现接口的这一课   java Jsoup在下载页面文本时将所有url分离   java将字符串转换为整数错误   java如何从mapDB数据库中检索数据,而不必每次都重写它?