通过从CSV fi中的数据手动创建多个URL来废弃这些URL中的数据

import scrapy class InsiderSpider(scrapy.Spider): name = 'insider' cik = 320193 allowed_domains = ['www.secform4.com'] start_urls = ['https://www.secform4.com/insider-trading/'+ str(cik) +'-0.htm']

2条回答

网友

1楼 · 编辑于 2024-05-13 03:22:50

可以将所有URL写入起始URL，但这不是最佳做法。你知道吗

使用

class MySpider(Spider):
    name = 'csv'

    def start_requests(self):
        with open('file.csv') as f:
            for line in f:
                if not line.strip():
                    continue
                yield Request(line)

如图所示： How to loop through multiple URLs to scrape from a CSV file in Scrapy? 相反。你知道吗

网友

2楼 · 编辑于 2024-05-13 03:22:50

df = '1326801', '320193'
urls = ['https://www.secform4.com/insider-trading/' + str(i) +'-0.htm' for i in df]
print(urls)
['https://www.secform4.com/insider-trading/1326801-0.htm', 'https://www.secform4.com/insider-trading/320193-0.htm']

编程相关推荐

javai是JAXB的新手。如何将两个具有不同名称空间的不同xml合并为一个具有根元素的xml并将其解组？
JDO中的java应该是可传递的DefaultFetchGroup吗
java服务器配置问题
java在理解JList时遇到困难
java何时将RequestContextFilter用于Jersey？
java从数据库中读取文本文件。jar文件
Java正则表达式，仅适用于不包括零的正数
爪哇番石榴。类路径中的jar
JavaEE：关于设计的问题
java GUI，在面板中排列按钮

相关问题更多 >

编程相关推荐

热门问题

热门文章

通过从CSV fi中的数据手动创建多个URL来废弃这些URL中的数据

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >