用scrapy下载一个完整的页面

import os,sys reload(sys) sys.setdefaultencoding('utf8') from selenium import webdriver url = 'https://es.wikipedia.org/wiki/Python' driver = webdriver.Firefox() driver.get(url) content = driver.page_source with open('source','w') as output: output.write(content)

1条回答

网友

1楼 · 发布于 2024-05-19 01:15:35

代码将下载此页并将其保存在文件download-a-full-page-with-scrapy.html

测试_scr.py

import scrapy
class TestSpider(scrapy.Spider):
    name = "test"

    start_urls = [
        "http://stackoverflow.com/questions/38233614/download-a-full-page-with-scrapy",
    ]

    def parse(self, response):
        filename = response.url.split("/")[-1] + '.html'
        with open(filename, 'wb') as f:
            f.write(response.body)

用这个命令运行scrapy

scrapy runspider test_scr.py

编程相关推荐

virtualbox无法从java移动共享文件夹中的文件
java如何连接Android 4.3.5（GA）的apache HttpClient库？
片段中的java Recyclerview未立即显示警报对话框结果
javac（n，r）计算器程序不工作
java使用BooleanQuery还是编写更多索引？
如何在java中设置y/n循环？
java不兼容的通用通配符捕获
java如何在安卓xml中编写数据绑定时的三元操作条件
java如何使用FileDialog？
java如何创建单元测试来检测是否有人使用错误的编码编辑了文件？

相关问题更多 >

编程相关推荐

热门问题

热门文章

用scrapy下载一个完整的页面

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >