使用循环在“start_url”函数中输入值从cs输入值

class MySpider(CrawlSpider): name = "test" allowed_domains = ["example.com"] import pandas as pd df = pd.read_csv('test.csv') saved_column = df.ProductName for a in saved_column: start_urls = ["http://www.example.com/search?noOfResults=20&keyword="+str(a)"] def parse(self,response):

1条回答

网友

1楼 · 发布于 2024-04-26 04:29:41

代码中存在概念错误。您正在进行循环，但除了旋转URL之外没有任何操作。所以parse函数是用循环的最后一个值来调用的。在

另一种可能的方法是重写spider的“start_requests”方法：

def start_requests(self):
    df = pd.read_csv('test.csv')
    saved_column = df.ProductName
    for url in saved_column:
        yield Request(url, self.parse)

从这里得到的想法：How to generate the start_urls dynamically in crawling?

编程相关推荐

bufferedreader JavasocketreadLine（）方法奇怪的行为
JavaSpring表单：选择多个默认情况下不选择第一个选项
在Java中调用方法之前检查参数的数量
mysql如何在java上执行算术。sql。时间物体？
安卓版libgdx中的java实现库
web应用中的Java内存管理
java异步任务停止工作安卓
Java Android：确保测验答案彼此不同
java内核32。例子在JNA中找不到ReadProcessMemory
Java生产者/消费者并发性问题尝试读取对象时，NoSuchElementFound异常

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用循环在“start_url”函数中输入值从cs输入值

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >