根据DOM标准递归下载以下链接

3条回答

网友

1楼 · 编辑于 2024-05-14 21:39:14

从WWW::Mechanize查看find_link函数（和同级）。它可以使用任意标准来查找包含“id”和“class”属性的链接。在

网友

2楼 · 编辑于 2024-05-14 21:39:14

Mojo::UserAgent返回理解CSS3选择器或XPath的内容。例如，我刚刚在Painless RSS processing with Mojo中展示了一个例子。我真的很喜欢这个新的（ish）web客户端的东西。大多数我想要的东西都已经在那里了（没有额外的模块），而且集成得很好。在

网友

3楼 · 编辑于 2024-05-14 21:39:14

这可能会让你朝着正确的方向开始，或者让你误入歧途。请注意，我首先将页面保存到一个本地文件中，这样就不会在工作时不断地下载它。在

#!/usr/bin/env perl

use strict;
use warnings;

use HTML::TreeBuilder::XPath;

my $tree = HTML::TreeBuilder::XPath->new;

$tree->parse_file('nmake-ref.html');

my @links = map { { $_->as_text => $_->attr('href') } }
            $tree->findnodes(q{//div[@class='sectionblock']/*/a});

for my $link (@links) {
    my ($entry, $url) = %{ $link };
    ($link->{ file } = "$entry.html" ) =~ s/[^A-Za-z_0-9.]+/_/g;
    system wget => qq{'$url'}, '-O', $link->{ file };
}

相关问题更多 >

编程相关推荐

热门问题

热门文章

根据DOM标准递归下载以下链接

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >