使用Python网络爬虫下载多个文件

0 投票

1 回答

553 浏览

提问于 2025-04-18 07:57

如果我有一个指向Yahoo财经的CSV文件的链接：http://ichart.finance.yahoo.com/table.csv?s=LOW&d=4&e=29&f=2014&g=d&a=8&b=22&c=1981&ignore=.csv

我该如何写一个网络爬虫，来根据一个符号列表下载多个文件呢？这个符号列表是：[LOW, SPY, AAPL]

from StringIO import StringIO 
from urllib2 import urlopen

for symbol in symbols:
    f = urlopen ('http://www.myurl.com'+symbol+'therestoftheurl')
    p = f.read()
    d = StringIO(p)
    f.close

我需要把这个网址的内容写入文件，还是它会自动下载到某个文件夹里呢？

自动化脚本文件处理网络爬虫数据抓取 csv文件数据下载爬虫框架符号列表

1 个回答

你可以用下面这种方法来下载文件：

import urllib2

file_name = "myfile.xyz"
u = urllib2.urlopen(url)
f = open(file_name, 'wb')

block_sz = 4096
while True:
    buffer = u.read(block_sz)
    if not buffer:
        break
    f.write(buffer)

f.close()

回答于 2025-04-18 由 Python大师

分享举报

使用Python网络爬虫下载多个文件

1 个回答

撰写回答