尝试从数据帧获取链接以提取信息

2024-06-12 11:41:18 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试得到一个循环工作,它将从创建的数据框架中获取链接,并继续进行更多的报废。我做错什么了?源链接是否在循环中读取?

df = pd.DataFrame(columns = ['link'],data=[url.a.get('href') for url in soup.find_all('div',class_="link")])


for i in range(0,33):
    link = df.iloc[i]
    source1 = urllib.request.urlopen(link).read()
    soup1 = bs.BeautifulSoup(source1,'lxml')
    for username in soup1.find_all('div', class_="user-name"):
        print(username.text)

Tags: 数据indiv框架urldffor链接
1条回答
网友
1楼 · 发布于 2024-06-12 11:41:18

代码的一个问题是从dataframe获取链接的方式。它应该是:

link = df.link.iloc[i]

而不是

^{pr2}$

因为后者返回一个object,而urlopen(link)需要一个string。如果提供了错误消息/stacktrace,我们将能够更好地猜测。在

相关问题 更多 >