下载独特的PDF文件

1条回答

网友

1楼 · 发布于 2024-05-19 01:41:42

就我个人而言，我发现使用CaspjerJS和PhantomJS从外部网站下载文件更容易，因为您可以将javascript代码注入页面以获取所需的元素。在

下面是我写的一些代码，可以从我的教授网页下载讲座并下载到我的桌面上：

var casper = require('casper').create({verbose: true , logLevel: "debug" });
var url = "https://www.cs.rit.edu/~ib/Classes/CSCI264_Fall16-17/assignments.html";
var fs = require('fs');
casper.start(url);
var elements; 
casper.then(function(){
    elements = this.evaluate(function(){ 
        var pdfs =  document.querySelectorAll('body ul li a'); 
        return Array.prototype.map.call(pdfs, function(e) {
            return e.getAttribute('href');
        });
    });
    for(var i = 0; i < elements.length; ++i){
        var url = "" + elements[i] + "";
        if(url.indexOf('pdf') !== -1){
            var file = fs.absolute(url.substring(url.lastIndexOf("/")+1, url.length));          
            this.download(url, file);   
        }
    }   
});


casper.run(function() {
    this.echo('Done.').exit();
});

当然，如果您对使用python没有任何兴趣，那么就完全忽略这一点。否则，祝你的CasperJS脚本好运。在

相关问题更多 >

编程相关推荐

热门问题

热门文章

下载独特的PDF文件

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >