爬虫程序正在获取相对链接

1条回答

网友

1楼 · 发布于 2024-06-17 12:50:36

答案是这样的

import scrapy

import os

class MySpider(scrapy.Spider):
    name = 'feed_exporter_test'
    # this is equivalent to what you would set in settings.py file
    custom_settings = {
        'FEED_FORMAT': 'csv',
        'FEED_URI': 'file1.csv'
    }
    filePath = 'file1.csv'
    if os.path.exists(filePath):
        os.remove(filePath)
    else:
        print("Can not delete the file as it doesn't exists")
    start_urls = ['https://www.jamoona.com/']

    def parse(self, response):
        urls = response.xpath("//a/@href").extract()
        for url in urls:
            abs_url = response.urljoin(url)
            yield {'title': abs_url}

编程相关推荐

空间计数器在Java中不起作用
json在java中表示XPath列表的最佳方式
java报警服务接收器安卓
java注入bean在自定义的all存储库中
java从迁移到Spring MVC 4+Hibernate5
JavaEclipseIDE透视图被缓存，更改没有任何影响
java Hibernate：在将对象插入Derby嵌入式数据库时引发SQLGrammerException
适用于mp4或mp3文件的java Exoplayer自动流媒体质量
安卓如何在java的静态方法中使用这个关键字？
SSL服务器端的spring主机名验证+Tomcat和Java 8

相关问题更多 >

编程相关推荐

热门问题

热门文章

爬虫程序正在获取相对链接

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >