从datafram列中存储的多个url中提取数据

2024-04-25 04:36:09 发布

您现在位置:Python中文网/ 问答频道 /正文

我想从多个url中提取数据,但是url位于数据帧的一列中。你知道吗

我用下面的代码尝试了数据提取,但没有成功。你知道吗

from urllib.request import urlopen,Request
link = data.column1
f = urlopen(link)
myfile = f.read()
print(myfile)

它显示:

AttributeError: 'Series' object has no attribute 'type'.

请帮忙写代码。 谢谢


Tags: 数据代码fromimporturlreaddatarequest
1条回答
网友
1楼 · 发布于 2024-04-25 04:36:09

问题是您试图同时对整个url系列执行操作。你知道吗

尝试迭代data.column1的项,不要忘记使用with处理资源,以防止潜在的内存泄漏:

from urllib.request import urlopen

for link in data['column1']:
    with urlopen(link) as response:
        myfile = response.read()
        print(myfile)

相关问题 更多 >