擅长:python、mysql、java
<p>创建站点地图的唯一自动方法是了解站点的结构并编写一个基于该知识的程序。仅仅对链接进行爬网通常是行不通的,因为链接可以在任何页面之间,所以可以得到一个图(即节点之间的连接)。在一般情况下,无法将图转换为树。</p>
<p>因此,您必须自己确定树的结构,然后爬行相关页面以获取页面的标题。</p>
<p>至于“但它只适用于三个层次”:三个层次就足够了。如果你试图创建更多的级别,你的站点地图将变得不可用(太大,太宽)。没有人会想下载一个1MB的网站地图,然后滚动10万页的链接。如果你的网站变得这么大,那么你必须实现某种搜索。</p>