尝试从数据帧获取链接以提取信息

2024-06-12 11:41:18 发布

男 | 程序猿一只，喜欢编程写python代码。

我正在尝试得到一个循环工作，它将从创建的数据框架中获取链接，并继续进行更多的报废。我做错什么了？源链接是否在循环中读取？

df = pd.DataFrame(columns = ['link'],data=[url.a.get('href') for url in soup.find_all('div',class_="link")])


for i in range(0,33):
    link = df.iloc[i]
    source1 = urllib.request.urlopen(link).read()
    soup1 = bs.BeautifulSoup(source1,'lxml')
    for username in soup1.find_all('div', class_="user-name"):
        print(username.text)

Tags：数据 in div 框架 url df for 链接

1条回答

网友

1楼 · 发布于 2024-06-12 11:41:18

代码的一个问题是从dataframe获取链接的方式。它应该是：

link = df.link.iloc[i]

而不是

^{pr2}$

因为后者返回一个object，而urlopen(link)需要一个string。如果提供了错误消息/stacktrace，我们将能够更好地猜测。在

尝试从数据帧获取链接以提取信息

相关问题更多 >

编程相关推荐

热门问题

热门文章

尝试从数据帧获取链接以提取信息

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >