将HTML页面显示为图形
webtree的Python项目详细描述
网络树
项目描述
所有的HTML文档都是树结构的。此项目提供了将HTML文档解析并可视化为图形的代码。
该项目的特点是:
- 以图形(连接节点的集合)的形式查看任何html页面(使用页面源)。在
- 按html标记、标记属性、字符串等搜索图形
- 找到HTML节点到图形中任何其他节点之间的最短路径,以便更轻松地进行web抓取。在
使用
{webtree scrape --site=https://www.google.com
- 项目
标签: